ドキュメント解析、画像テキスト抽出、ドキュメント分割などのサービスを使用する - OpenSearch

Search Development Workbenchコンソールのエクスペリエンスセンターでは、ドキュメント解析、画像テキスト抽出、ドキュメント分割など、さまざまなサービスを視覚的に使用できます。これにより、サービスがビジネス要件を満たしているかどうかを迅速に評価できます。

機能

次の表は、エクスペリエンスセンターで提供されるサービスについて説明しています。

カテゴリ	説明
ドキュメントコンテンツ解析	ドキュメントコンテンツ解析サービス（ops-document-analyze-001）は、汎用ドキュメント解析サービスを提供します。このサービスを使用すると、テキスト、表、画像などの非構造化ドキュメントから、タイトルや段落などの論理構造を抽出して、構造化データを生成できます。
画像コンテンツ解析	画像コンテンツ認識サービス001（ops-image-analyze-vlm-001）を使用すると、マルチモーダル大規模言語モデル（LLM）に基づいて画像のコンテンツを解析できます。また、このサービスを使用して画像内のテキストを解析し、解析されたテキストを画像検索や会話型検索に使用することもできます。画像テキスト認識サービス001（ops-image-analyze-ocr-001）を使用すると、光学式文字認識（OCR）機能を使用して画像内のテキストを認識し、認識されたテキストを画像検索や会話型検索に使用できます。
ドキュメントスライス	共通ドキュメントスライスサービス（ops-document-split-001）は、汎用テキスト分割サービスを提供します。このサービスを使用すると、HTML、MARKDOWN、TXT形式の構造化データを、段落、セマンティクス、特定のルールに基づいて分割できます。また、リッチテキストからコード、画像、表を抽出することもできます。
テキストベクトル化	OpenSearchテキストベクトル化サービス-001（ops-text-embedding-001）は、40以上の言語をサポートするテキストベクトル化サービスを提供します。入力テキストの長さは最大300トークンで、生成されるベクトルの次元は1,536です。 OpenSearchユニバーサルテキストベクトル化サービス-002（ops-text-embedding-002）は、100以上の言語をサポートするテキストベクトル化サービスを提供します。入力テキストの長さは最大8,192トークンで、生成されるベクトルの次元は1,024です。 OpenSearchテキストベクトル化サービス-中国語-001（ops-text-embedding-zh-001）は、中国語テキスト用のテキストベクトル化サービスを提供します。入力テキストの長さは最大1,024トークンで、生成されるベクトルの次元は768です。 OpenSearchテキストベクトル化サービス-英語-001（ops-text-embedding-en-001）は、英語テキスト用のテキストベクトル化サービスを提供します。入力テキストの長さは最大512トークンで、生成されるベクトルの次元は768です。
テキストスパースベクトル化	このサービスは、テキストデータをストレージ容量の少ないスパースベクトルに変換します。スパースベクトルを使用して、キーワードと頻繁に使用される用語に関する情報を表現できます。スパースベクトルとデンスベクトルを使用してハイブリッド検索を実行し、検索パフォーマンスを向上させることができます。 OpenSearchテキストスパースベクトル化サービス-汎用（ops-text-sparse-embedding-001）は、100以上の言語をサポートするテキストベクトル化サービスを提供します。入力テキストの長さは最大8,192トークンです。
クエリ分析	このサービスは、LLMと自然言語処理（NLP）機能に基づいて、ユーザーの意図を理解し、類似の質問を拡張し、自然言語の質問をSQLステートメントに変換するためのコンテンツ分析サービスを提供します。これにより、Retrieval Augmented Generation（RAG）シナリオでの会話型検索のパフォーマンスが向上します。クエリ分析サービス001（ops-query-analyze-001）は、ユーザーの意図を理解し、類似の質問を拡張するための、LLMベースの汎用クエリ分析をサポートしています。
ソートサービス	BGE再配置モデル（ops-bge-reranker-larger）は、汎用ドキュメントスコアリングサービスを提供します。このサービスは、クエリとドキュメントコンテンツの関連性に基づいてドキュメントをスコアリングし、スコアに基づいてドキュメントを降順にソートしてから、スコアを返します。このサービスは、中国語と英語をサポートしています。入力テキストの長さは最大512トークンで、これにはクエリとドキュメントの長さが含まれます。 OpenSearchテキスト再ランキング-001（ops-text-reranker-001）は、OpenSearchチームによって開発され、複数の業界のデータセットを使用してトレーニングされた、高品質の再ランキングサービスを提供します。このサービスは、クエリとドキュメントコンテンツの関連性に基づいてドキュメントを降順にソートできます。このサービスは、中国語と英語をサポートしています。入力テキストの長さは最大512トークンで、これにはクエリとドキュメントの長さが含まれます。
ソートサービス
大規模モデル	OpenSearch-あらゆる意味の何千もの質問-Turbo（ops-qwen-turbo）は、qwen-turboモデルに基づいて開発されたモデルです。このモデルは、教師ありファインチューニング後に強化され、モデルが偏ったコンテンツを返す確率が低くなります。通義千問-Turbo（qwen-turbo）は、中国語や英語など複数の入力言語をサポートするQwen超大規模言語モデルです。詳細については、モデルの概要を参照してください。通義千問-Plus（qwen-plus）は、中国語や英語など複数の入力言語をサポートするqwen-turboモデルの強化版です。詳細については、モデルの概要を参照してください。通義千問-Max（qwen-max）は、数百億のパラメーターと中国語や英語など複数の入力言語をサポートするQwen超大規模言語モデルです。詳細については、モデルの概要を参照してください。

手順

ドキュメント解析サービスを使用する

OpenSearchコンソールにログオンします。
上部のナビゲーションバーでリージョンを選択します。左上隅で、Search Development Workbenchを選択します。
左側のナビゲーションペインで、エクスペリエンスセンターをクリックします。
エクスペリエンスセンターページで、サービスタイプドロップダウンリストからドキュメントコンテンツ解析（document-analyze）を選択し、エクスペリエンスサービスドロップダウンリストからサービスを選択します。
エクスペリエンスデータパラメーターをサンプルデータまたはマイデータに設定します。エクスペリエンスデータパラメーターをマイデータに設定した場合、データの管理をクリックしてデータをアップロードできます。サポートされているファイルタイプは、TXT、PDF、HTML、DOC、DOCX、PPT、PPTXです。各ファイルのサイズは最大20MBです。
- ローカルファイルをアップロードする：アップロードされたファイルは7日後に自動的に消去されます。コンソールはデータを永続的に保存しません。
- ファイルのURLを指定し、ファイルタイプを指定する：複数のファイルURLを指定できます。各ファイルURLは別々の行に配置されます。
  説明
  ファイルタイプを間違って選択すると、アップロードしたデータの解析に失敗します。ドキュメント解析の失敗を防ぐには、ファイルデータに基づいて正しいファイルタイプを選択する必要があります。
  重要
  URLを使用してファイルをインポートする場合は、操作が法律、規制、および関連プラットフォームの管理基準に準拠しており、権利者の正当な権利または利益を侵害していないことを確認してください。上記の要件の違反については、お客様が単独で責任を負います。ツールプロバイダーとして、Search Development Workbenchは、お客様が実行するデータ解析またはデータダウンロードについて一切の責任を負いません。
データを使用する場合は、ドロップダウンリストからアップロードされたファイルまたはURLを選択します。
結果の取得をクリックします。システムはドキュメント解析サービスを呼び出してファイルを解析します。次のタブで結果を表示できます：
- 結果：解析の進捗状況と結果を表示します。
- 結果ソースコード：結果レスポンスコードを表示します。コードのコピーをクリックしてコードをコピーするか、ファイルのダウンロードをクリックしてコードをコンピューターにダウンロードできます。
- サンプルコード：ドキュメント解析サービスを呼び出すためのサンプルコードを表示およびダウンロードできます。

ドキュメント分割サービスを使用する

OpenSearchコンソールにログオンします。
上部のナビゲーションバーでリージョンを選択します。左上隅で、Search Development Workbenchを選択します。
左側のナビゲーションペインで、エクスペリエンスセンターをクリックします。
エクスペリエンスセンターページで、サービスタイプドロップダウンリストからドキュメントスライス（document-split）を選択し、エクスペリエンスサービスドロップダウンリストからサービスを選択します。
エクスペリエンスデータパラメーターをサンプルデータまたはマイデータに設定します。エクスペリエンスデータパラメーターをマイデータに設定した場合、エディターにデータを入力できます。サポートされているデータ形式は、TXT、HTML、MARKDOWNです。
説明
間違ったデータ形式を選択すると、入力したデータの解析に失敗します。ドキュメント解析の失敗を防ぐには、正しいデータ形式を使用する必要があります。
最大スライス長パラメーターを設定します。単位：トークン。デフォルト値：300。最大値は1024です。
結果の取得をクリックします。システムはドキュメント分割サービスを呼び出してデータを分割します。次のタブで結果を表示できます：
- 結果：分割の進捗状況と結果を表示します。
- 結果ソースコード：結果レスポンスコードを表示します。コードのコピーをクリックしてコードをコピーするか、ファイルのダウンロードをクリックしてコードをコンピューターにダウンロードできます。
- サンプルコード：ドキュメント分割サービスを呼び出すためのサンプルコードを表示およびダウンロードできます。

テキストベクトル化またはテキストスパースベクトル化サービスを使用する

OpenSearchコンソールにログオンします。
上部のナビゲーションバーでリージョンを選択します。左上隅で、Search Development Workbenchを選択します。
左側のナビゲーションペインで、エクスペリエンスセンターをクリックします。
エクスペリエンスセンターページで、サービスタイプドロップダウンリストからテキストベクトル化（text-embedding）またはテキストスパースベクトル化（text-sparse-embedding）を選択し、エクスペリエンスサービスドロップダウンリストからサービスを選択します。
コンテンツタイプパラメーターをドキュメントまたはクエリに設定します。
テキストグループを追加するか、JSON形式のデータを直接入力します。
結果の取得をクリックします。システムはテキストベクトル化またはテキストスパースベクトル化サービスを呼び出してテキストをベクトル化します。次のタブで結果を表示できます：
- 結果：ベクトル化の進捗状況と結果を表示します。
- 結果ソースコード：結果レスポンスコードを表示します。コードのコピーをクリックしてコードをコピーするか、ファイルのダウンロードをクリックしてコードをコンピューターにダウンロードできます。
- サンプルコード：テキストベクトル化またはテキストスパースベクトル化サービスを呼び出すためのサンプルコードを表示およびダウンロードできます。

ソートサービスを使用する

OpenSearchコンソールにログオンします。
上部のナビゲーションバーでリージョンを選択します。左上隅で、Search Development Workbenchを選択します。
左側のナビゲーションペインで、エクスペリエンスセンターをクリックします。
エクスペリエンスセンターページで、サービスタイプドロップダウンリストからソートサービス（ranker）を選択し、エクスペリエンスサービスドロップダウンリストからサービスを選択します。
エクスペリエンスデータパラメーターをサンプルデータまたはマイデータに設定します。
クエリフィールドに情報を入力します。
結果の取得をクリックします。システムはソートサービスを呼び出して、クエリとドキュメントコンテンツの関連性に基づいてドキュメントをソートし、スコアリング結果を返します。次のタブで結果を表示できます：
- 結果：ソートとスコアリングの結果を表示します。
- 結果ソースコード：結果レスポンスコードを表示します。コードのコピーをクリックしてコードをコピーするか、ファイルのダウンロードをクリックしてコードをコンピューターにダウンロードできます。
- サンプルコード：ソートサービスを呼び出すためのサンプルコードを表示およびダウンロードできます。

LLMを使用する

OpenSearchコンソールにログオンします。
上部のナビゲーションバーでリージョンを選択します。左上隅で、Search Development Workbenchを選択します。
左側のナビゲーションペインで、エクスペリエンスセンターをクリックします。
エクスペリエンスセンターページで、サービスタイプドロップダウンリストから大規模モデル（text-generation）を選択し、エクスペリエンスサービスドロップダウンリストからサービスを選択します。
質問を入力し、送信アイコンをクリックします。LLMは質問を分析して回答を提供します。
重要
すべての回答はAIモデルによって生成されます。AIモデルによって生成されたコンテンツは不正確または不完全である可能性があり、アリババクラウドの態度または意見を反映するものではありません。
結果タブには、この会話で使用された入力トークンと出力トークンの数が表示されます。会話をクリアをクリックしてこの会話を削除できます。

画像コンテンツ解析サービスを使用する

OpenSearchコンソールにログオンします。
上部のナビゲーションバーでリージョンを選択します。左上隅で、Search Development Workbenchを選択します。
左側のナビゲーションペインで、エクスペリエンスセンターをクリックします。
エクスペリエンスセンターページで、サービスタイプドロップダウンリストから画像コンテンツ解析（image-analyze）を選択し、エクスペリエンスサービスドロップダウンリストからサービスを選択します。
エクスペリエンスデータパラメーターをサンプルデータまたはマイデータに設定します。
結果の取得をクリックします。システムは画像コンテンツ解析サービスを呼び出して画像コンテンツを分析し、結果を生成するか、画像の重要な情報を識別してエクスポートします。次のタブで結果を表示できます：
- 結果：コンテンツ解析結果を表示します。
- 結果ソースコード：結果レスポンスコードを表示します。コードのコピーをクリックしてコードをコピーするか、ファイルのダウンロードをクリックしてコードをコンピューターにダウンロードできます。
- サンプルコード：画像コンテンツ解析サービスを呼び出すためのサンプルコードを表示およびダウンロードできます。

クエリ分析サービスを使用する

OpenSearchコンソールにログオンします。
上部のナビゲーションバーでリージョンを選択します。左上隅で、Search Development Workbenchを選択します。
左側のナビゲーションペインで、エクスペリエンスセンターをクリックします。
エクスペリエンスセンターページで、サービスタイプドロップダウンリストからクエリ分析（query-analyze）を選択し、エクスペリエンスサービスドロップダウンリストからサービスを選択します。
クエリフィールドに質問を直接入力します。または、履歴メッセージセクションで複数ラウンドの会話を構築してから、クエリフィールドに質問を入力します。モデルは、複数ラウンドの会話と質問を組み合わせて、クエリの意図を識別します。
NL2SQLを表示をオンにし、サービス構成ドロップダウンリストから作成済みのサービス構成を選択します。自然言語で質問を入力できます。NL2SQLサービスは、自然言語の質問をSQLステートメントに変換します。
結果の取得をクリックします。次のタブで結果を表示できます：
- 結果：クエリ分析結果を表示します。
- 結果ソースコード：結果レスポンスコードを表示します。コードのコピーをクリックしてコードをコピーするか、ファイルのダウンロードをクリックしてコードをコンピューターにダウンロードできます。
- サンプルコード：クエリ分析サービスを呼び出すためのサンプルコードを表示およびダウンロードできます。