Search Development Workbenchコンソールのエクスペリエンスセンターでは、ドキュメント解析、画像テキスト抽出、ドキュメント分割など、さまざまなサービスを視覚的に使用できます。これにより、サービスがビジネス要件を満たしているかどうかを迅速に評価できます。
機能
次の表は、エクスペリエンスセンターで提供されるサービスについて説明しています。
カテゴリ | 説明 |
ドキュメントコンテンツ解析 | ドキュメントコンテンツ解析サービス(ops-document-analyze-001)は、汎用ドキュメント解析サービスを提供します。このサービスを使用すると、テキスト、表、画像などの非構造化ドキュメントから、タイトルや段落などの論理構造を抽出して、構造化データを生成できます。 |
画像コンテンツ解析 |
|
ドキュメントスライス | 共通ドキュメントスライスサービス(ops-document-split-001)は、汎用テキスト分割サービスを提供します。このサービスを使用すると、HTML、MARKDOWN、TXT形式の構造化データを、段落、セマンティクス、特定のルールに基づいて分割できます。また、リッチテキストからコード、画像、表を抽出することもできます。 |
テキストベクトル化 |
|
テキストスパースベクトル化 | このサービスは、テキストデータをストレージ容量の少ないスパースベクトルに変換します。スパースベクトルを使用して、キーワードと頻繁に使用される用語に関する情報を表現できます。スパースベクトルとデンスベクトルを使用してハイブリッド検索を実行し、検索パフォーマンスを向上させることができます。 OpenSearchテキストスパースベクトル化サービス-汎用(ops-text-sparse-embedding-001)は、100以上の言語をサポートするテキストベクトル化サービスを提供します。入力テキストの長さは最大8,192トークンです。 |
クエリ分析 | このサービスは、LLMと自然言語処理(NLP)機能に基づいて、ユーザーの意図を理解し、類似の質問を拡張し、自然言語の質問をSQLステートメントに変換するためのコンテンツ分析サービスを提供します。これにより、Retrieval Augmented Generation(RAG)シナリオでの会話型検索のパフォーマンスが向上します。 クエリ分析サービス001(ops-query-analyze-001)は、ユーザーの意図を理解し、類似の質問を拡張するための、LLMベースの汎用クエリ分析をサポートしています。 |
ソートサービス |
|
大規模モデル |
|
手順
ドキュメント解析サービスを使用する
OpenSearchコンソールにログオンします。
上部のナビゲーションバーでリージョンを選択します。左上隅で、Search Development Workbenchを選択します。
左側のナビゲーションペインで、エクスペリエンスセンターをクリックします。
エクスペリエンスセンターページで、サービスタイプドロップダウンリストからドキュメントコンテンツ解析(document-analyze)を選択し、エクスペリエンスサービスドロップダウンリストからサービスを選択します。
エクスペリエンスデータパラメーターをサンプルデータまたはマイデータに設定します。エクスペリエンスデータパラメーターをマイデータに設定した場合、データの管理をクリックしてデータをアップロードできます。サポートされているファイルタイプは、TXT、PDF、HTML、DOC、DOCX、PPT、PPTXです。各ファイルのサイズは最大20MBです。
ローカルファイルをアップロードする:アップロードされたファイルは7日後に自動的に消去されます。コンソールはデータを永続的に保存しません。
ファイルのURLを指定し、ファイルタイプを指定する:複数のファイルURLを指定できます。各ファイルURLは別々の行に配置されます。
説明ファイルタイプを間違って選択すると、アップロードしたデータの解析に失敗します。ドキュメント解析の失敗を防ぐには、ファイルデータに基づいて正しいファイルタイプを選択する必要があります。
重要URLを使用してファイルをインポートする場合は、操作が法律、規制、および関連プラットフォームの管理基準に準拠しており、権利者の正当な権利または利益を侵害していないことを確認してください。上記の要件の違反については、お客様が単独で責任を負います。ツールプロバイダーとして、Search Development Workbenchは、お客様が実行するデータ解析またはデータダウンロードについて一切の責任を負いません。
データを使用する場合は、ドロップダウンリストからアップロードされたファイルまたはURLを選択します。
結果の取得をクリックします。システムはドキュメント解析サービスを呼び出してファイルを解析します。次のタブで結果を表示できます:
結果:解析の進捗状況と結果を表示します。
結果ソースコード:結果レスポンスコードを表示します。コードのコピーをクリックしてコードをコピーするか、ファイルのダウンロードをクリックしてコードをコンピューターにダウンロードできます。
サンプルコード:ドキュメント解析サービスを呼び出すためのサンプルコードを表示およびダウンロードできます。
ドキュメント分割サービスを使用する
OpenSearchコンソールにログオンします。
上部のナビゲーションバーでリージョンを選択します。左上隅で、Search Development Workbenchを選択します。
左側のナビゲーションペインで、エクスペリエンスセンターをクリックします。
エクスペリエンスセンターページで、サービスタイプドロップダウンリストからドキュメントスライス(document-split)を選択し、エクスペリエンスサービスドロップダウンリストからサービスを選択します。
エクスペリエンスデータパラメーターをサンプルデータまたはマイデータに設定します。エクスペリエンスデータパラメーターをマイデータに設定した場合、エディターにデータを入力できます。サポートされているデータ形式は、TXT、HTML、MARKDOWNです。
説明間違ったデータ形式を選択すると、入力したデータの解析に失敗します。ドキュメント解析の失敗を防ぐには、正しいデータ形式を使用する必要があります。
最大スライス長パラメーターを設定します。単位:トークン。デフォルト値:300。最大値は1024です。
結果の取得をクリックします。システムはドキュメント分割サービスを呼び出してデータを分割します。次のタブで結果を表示できます:
結果:分割の進捗状況と結果を表示します。
結果ソースコード:結果レスポンスコードを表示します。コードのコピーをクリックしてコードをコピーするか、ファイルのダウンロードをクリックしてコードをコンピューターにダウンロードできます。
サンプルコード:ドキュメント分割サービスを呼び出すためのサンプルコードを表示およびダウンロードできます。
テキストベクトル化またはテキストスパースベクトル化サービスを使用する
OpenSearchコンソールにログオンします。
上部のナビゲーションバーでリージョンを選択します。左上隅で、Search Development Workbenchを選択します。
左側のナビゲーションペインで、エクスペリエンスセンターをクリックします。
エクスペリエンスセンターページで、サービスタイプドロップダウンリストからテキストベクトル化(text-embedding)またはテキストスパースベクトル化(text-sparse-embedding)を選択し、エクスペリエンスサービスドロップダウンリストからサービスを選択します。
コンテンツタイプパラメーターをドキュメントまたはクエリに設定します。
テキストグループを追加するか、JSON形式のデータを直接入力します。
結果の取得をクリックします。システムはテキストベクトル化またはテキストスパースベクトル化サービスを呼び出してテキストをベクトル化します。次のタブで結果を表示できます:
結果:ベクトル化の進捗状況と結果を表示します。
結果ソースコード:結果レスポンスコードを表示します。コードのコピーをクリックしてコードをコピーするか、ファイルのダウンロードをクリックしてコードをコンピューターにダウンロードできます。
サンプルコード:テキストベクトル化またはテキストスパースベクトル化サービスを呼び出すためのサンプルコードを表示およびダウンロードできます。
ソートサービスを使用する
OpenSearchコンソールにログオンします。
上部のナビゲーションバーでリージョンを選択します。左上隅で、Search Development Workbenchを選択します。
左側のナビゲーションペインで、エクスペリエンスセンターをクリックします。
エクスペリエンスセンターページで、サービスタイプドロップダウンリストからソートサービス(ranker)を選択し、エクスペリエンスサービスドロップダウンリストからサービスを選択します。
エクスペリエンスデータパラメーターをサンプルデータまたはマイデータに設定します。
クエリフィールドに情報を入力します。
結果の取得をクリックします。システムはソートサービスを呼び出して、クエリとドキュメントコンテンツの関連性に基づいてドキュメントをソートし、スコアリング結果を返します。次のタブで結果を表示できます:
結果:ソートとスコアリングの結果を表示します。
結果ソースコード:結果レスポンスコードを表示します。コードのコピーをクリックしてコードをコピーするか、ファイルのダウンロードをクリックしてコードをコンピューターにダウンロードできます。
サンプルコード:ソートサービスを呼び出すためのサンプルコードを表示およびダウンロードできます。
LLMを使用する
OpenSearchコンソールにログオンします。
上部のナビゲーションバーでリージョンを選択します。左上隅で、Search Development Workbenchを選択します。
左側のナビゲーションペインで、エクスペリエンスセンターをクリックします。
エクスペリエンスセンターページで、サービスタイプドロップダウンリストから大規模モデル(text-generation)を選択し、エクスペリエンスサービスドロップダウンリストからサービスを選択します。
質問を入力し、送信アイコンをクリックします。LLMは質問を分析して回答を提供します。
重要すべての回答はAIモデルによって生成されます。AIモデルによって生成されたコンテンツは不正確または不完全である可能性があり、アリババクラウドの態度または意見を反映するものではありません。
結果タブには、この会話で使用された入力トークンと出力トークンの数が表示されます。会話をクリアをクリックしてこの会話を削除できます。
画像コンテンツ解析サービスを使用する
OpenSearchコンソールにログオンします。
上部のナビゲーションバーでリージョンを選択します。左上隅で、Search Development Workbenchを選択します。
左側のナビゲーションペインで、エクスペリエンスセンターをクリックします。
エクスペリエンスセンターページで、サービスタイプドロップダウンリストから画像コンテンツ解析(image-analyze)を選択し、エクスペリエンスサービスドロップダウンリストからサービスを選択します。
エクスペリエンスデータパラメーターをサンプルデータまたはマイデータに設定します。
結果の取得をクリックします。システムは画像コンテンツ解析サービスを呼び出して画像コンテンツを分析し、結果を生成するか、画像の重要な情報を識別してエクスポートします。次のタブで結果を表示できます:
結果:コンテンツ解析結果を表示します。
結果ソースコード:結果レスポンスコードを表示します。コードのコピーをクリックしてコードをコピーするか、ファイルのダウンロードをクリックしてコードをコンピューターにダウンロードできます。
サンプルコード:画像コンテンツ解析サービスを呼び出すためのサンプルコードを表示およびダウンロードできます。
クエリ分析サービスを使用する
OpenSearchコンソールにログオンします。
上部のナビゲーションバーでリージョンを選択します。左上隅で、Search Development Workbenchを選択します。
左側のナビゲーションペインで、エクスペリエンスセンターをクリックします。
エクスペリエンスセンターページで、サービスタイプドロップダウンリストからクエリ分析(query-analyze)を選択し、エクスペリエンスサービスドロップダウンリストからサービスを選択します。
クエリフィールドに質問を直接入力します。または、履歴メッセージセクションで複数ラウンドの会話を構築してから、クエリフィールドに質問を入力します。モデルは、複数ラウンドの会話と質問を組み合わせて、クエリの意図を識別します。
NL2SQLを表示をオンにし、サービス構成ドロップダウンリストから作成済みのサービス構成を選択します。自然言語で質問を入力できます。NL2SQLサービスは、自然言語の質問をSQLステートメントに変換します。
結果の取得をクリックします。次のタブで結果を表示できます:
結果:クエリ分析結果を表示します。
結果ソースコード:結果レスポンスコードを表示します。コードのコピーをクリックしてコードをコピーするか、ファイルのダウンロードをクリックしてコードをコンピューターにダウンロードできます。
サンプルコード:クエリ分析サービスを呼び出すためのサンプルコードを表示およびダウンロードできます。