すべてのプロダクト
Search
ドキュメントセンター

OpenSearch:テキストアナライザー

最終更新日:Dec 28, 2024

キーワードアナライザー

説明: このアナライザーは、テキストを単語に分割しません。完全一致検索に適しています。たとえば、タグ、キーワード、全体として処理する必要がある文字列、数値に適用できます。

使用上の注意: このアナライザーは、LITERAL、INT、LITERAL_ARRAY、およびINT_ARRAYタイプのフィールドに適用されます。

:

If the value of a field is "chrysanthemum tea" in a document and the keyword analyzer is used, the document can be retrieved only when you search for "chrysanthemum tea". //ドキュメント内のフィールドの値が「chrysanthemum tea」で、キーワードアナライザーが使用されている場合、ドキュメントは「chrysanthemum tea」を検索した場合にのみ取得できます。

中国語向け汎用アナライザー

説明: このアナライザーは、中国語のセマンティクスに基づいて検索単位ごとにテキストを分割します。ほとんどの業界に適用される汎用アナライザーです。このアナライザーは、業界固有のアナライザーです。

使用上の注意: このアナライザーは、TEXTおよびSHORT_TEXTタイプのフィールドに適用されます。

:

If the value of a field is "菊花茶" in a document and the general analyzer for Chinese is used, the document can be retrieved when you search for "菊花茶", "菊花", "茶", or "花茶". //ドキュメント内のフィールドの値が「菊花茶」で、中国語向け汎用アナライザーが使用されている場合、ドキュメントは「菊花茶」、「菊花」、「茶」、または「花茶」を検索した場合に取得できます。

中国語向けEコマースアナライザー

説明: このアナライザーは、Eコマース業界に適用できます。

使用上の注意: このアナライザーは、TEXTおよびSHORT_TEXTタイプのフィールドに適用されます。

:

If the value of a field is "大宝SOD蜜" in a document and the E-commerce analyzer for Chinese is used, the document can be retrieved when you search for "大宝", "sod", "sod蜜", "SOD蜜", or "蜜". //ドキュメント内のフィールドの値が「大宝SOD蜜」で、中国語向けEコマースアナライザーが使用されている場合、ドキュメントは「大宝」、「sod」、「sod蜜」、「SOD蜜」、または「蜜」を検索した場合に取得できます。

中国語向け単一文字アナライザー

説明: このアナライザーは、テキストを漢字と単語に分割します。著者名や店舗名など、中国語のセマンティクスに基づかない検索に適しています。

使用上の注意: このアナライザーは、TEXTおよびSHORT_TEXTタイプのフィールドに適用されます。

:

If the value of a field is "菊花茶" in a document and the single character analyzer for Chinese is used, the document can be retrieved when you search for "菊花茶", "菊花", "茶", "花茶", "菊", "花", or "菊茶". //ドキュメント内のフィールドの値が「菊花茶」で、中国語向け単一文字アナライザーが使用されている場合、ドキュメントは「菊花茶」、「菊花」、「茶」、「花茶」、「菊」、「花」、または「菊茶」を検索した場合に取得できます。

あいまい検索アナライザー

説明: このアナライザーを使用すると、システムはピンイン、接頭辞または接尾辞、単一の単語または単一の文字による検索をサポートできます。中国語のテキストは、接頭辞または接尾辞による検索をサポートしていません。文字、数字、ピンインは、接頭辞または接尾辞による検索をサポートしています。このアナライザーは、サイズが100バイトを超えないフィールドのみをサポートしています。詳細については、あいまい検索を参照してください。

使用上の注意: このアナライザーは、SHORT_TEXTタイプのフィールドに適用されます。

:

If the value of a field is "菊花茶" in a document and the fuzzy analyzer is used, the document can be retrieved when you search for "菊花茶", "菊花", "茶", "花茶", "菊", "花", "菊茶", "ju", "juhua", "juhuacha", "j", "jh", or "jhc". 
If the value of a field is the mobile number "138****5678" in a document and the fuzzy analyzer is used, the document can be retrieved when you search for "^138" or "5678$". "^138" instructs the system to search for all mobile numbers that start with "138". "5678$" instructs the system to search for all mobile numbers that end with "5678". 
If the value of a field is "OpenSearch" in a document and the fuzzy analyzer is used, the document can be retrieved when you search for a single letter that is contained in the value or a combination of consecutive letters that are contained in the value. //ドキュメント内のフィールドの値が「菊花茶」で、あいまい検索アナライザーが使用されている場合、ドキュメントは「菊花茶」、「菊花」、「茶」、「花茶」、「菊」、「花」、「菊茶」、「ju」、「juhua」、「juhuacha」、「j」、「jh」、または「jhc」を検索した場合に取得できます。
//ドキュメント内のフィールドの値が携帯電話番号「138****5678」で、あいまい検索アナライザーが使用されている場合、ドキュメントは「^138」または「5678$」を検索した場合に取得できます。「^138」は、システムに「138」で始まるすべての携帯電話番号を検索するように指示します。「5678$」は、システムに「5678」で終わるすべての携帯電話番号を検索するように指示します。
//ドキュメント内のフィールドの値が「OpenSearch」で、あいまい検索アナライザーが使用されている場合、ドキュメントは値に含まれる単一の文字、または値に含まれる連続した文字の組み合わせを検索した場合に取得できます。

英語向け語幹アナライザー

説明: このアナライザーは、各英語の単語を語幹に分割します。英語のセマンティクスに基づく検索に適しています。

使用上の注意: このアナライザーは、TEXTおよびSHORT_TEXTタイプのフィールドに適用されます。このアナライザーは、クエリ分析をサポートしていません。

:

If the value of a field is "英文分词器 english analyzer" in a document and the word stemming analyzer for English is used, the document can be retrieved when you search for "英文分词器", "english", "analyz", "analyzer", "analyzers", "analyze", "analyzed", or "analyzing". 
Note: An English text analyzer analyzes consecutive Chinese characters as one word. //ドキュメント内のフィールドの値が「英文分词器 english analyzer」で、英語向け語幹アナライザーが使用されている場合、ドキュメントは「英文分词器」、「english」、「analyz」、「analyzer」、「analyzers」、「analyze」、「analyzed」、または「analyzing」を検索した場合に取得できます。
//注:英語テキストアナライザーは、連続した漢字を1つの単語として分析します。

英語向け非語幹単語アナライザー

説明: このアナライザーは、スペースと句読点に基づいてテキストを分割します。書籍のタイトルや著者名など、英語のセマンティクスに基づかない検索に適しています。

使用上の注意: このアナライザーは、TEXTおよびSHORT_TEXTタイプのフィールドに適用されます。このアナライザーは、クエリ分析をサポートしていません。

:

If the value of a field is "英文分词器 english analyzer" in a document and the unstemmed word analyzer for English is used, the document can be retrieved when you search for "英文分词器", "english", or "analyzer". 
Note: An English text analyzer analyzes consecutive Chinese characters as one word. //ドキュメント内のフィールドの値が「英文分词器 english analyzer」で、英語向け非語幹単語アナライザーが使用されている場合、ドキュメントは「英文分词器」、「english」、または「analyzer」を検索した場合に取得できます。
//注:英語テキストアナライザーは、連続した漢字を1つの単語として分析します。

英語向け詳細分析アナライザー

説明: このアナライザーは、英語のセマンティクスに基づいて検索単位ごとにテキストを分割します。一般業界の英語テキスト分析に適用されるアナライザーです。

使用上の注意: このアナライザーは、TEXTおよびSHORT_TEXTタイプのフィールドに適用されます。

このアナライザーは、専用アプリケーションに固有です。

:

If the value of a field is "dataprocess" in a document and the analyzer for fine-grained analysis for English is used, the analysis result is "data process". In this case, the document can be retrieved when you search for "dataprocess", "data process", "data", or "process". //ドキュメント内のフィールドの値が「dataprocess」で、英語向け詳細分析アナライザーが使用されている場合、分析結果は「data process」になります。この場合、ドキュメントは「dataprocess」、「data process」、「data」、または「process」を検索した場合に取得できます。

完全ピンインアナライザー

説明: このアナライザーを使用すると、完全ピンインまたは省略ピンインの最初の文字を使用して、短いテキストで漢字を検索できます。映画名や著者名など、完全ピンインまたは省略ピンインに基づく検索に適しています。完全ピンインに基づいて文字を検索するには、完全ピンインの一部ではなく、漢字の完全ピンインを入力する必要があります。

使用上の注意: このアナライザーは、SHORT_TEXTタイプのフィールドに適用されます。

:

If the value of a field is "大内密探007" in a document and the full pinyin spelling analyzer is used, the document can be retrieved when you search for "d", "dn", "dnm", "dnmt", "dnmt007", "da", "danei", "daneimi", or "daneimitan". The document cannot be retrieved when you search for "an" or "anei". //ドキュメント内のフィールドの値が「大内密探007」で、完全ピンインアナライザーが使用されている場合、ドキュメントは「d」、「dn」、「dnm」、「dnmt」、「dnmt007」、「da」、「danei」、「daneimi」、または「daneimitan」を検索した場合に取得できます。ドキュメントは、「an」または「anei」を検索した場合には取得できません。

省略ピンインアナライザー

説明: このアナライザーを使用すると、省略ピンインの最初の文字を使用して、短いテキストで漢字を検索できます。映画名や著者名など、省略ピンインに基づく検索に適しています。

使用上の注意: このアナライザーは、SHORT_TEXTタイプのフィールドに適用されます。

:

If the value of a field is "大内密探007" in a document and the abbreviated pinyin spelling analyzer is used, the document can be retrieved when you search for "d", "dn", "dnm", "dnmt", "dnmt0", "damt007", "m", "mt", "mt007", or "007". //ドキュメント内のフィールドの値が「大内密探007」で、省略ピンインアナライザーが使用されている場合、ドキュメントは「d」、「dn」、「dnm」、「dnmt」、「dnmt0」、「damt007」、「m」、「mt」、「mt007」、または「007」を検索した場合に取得できます。

シンプルアナライザー

説明: このアナライザーを使用すると、検索を完全に制御できます。他の組み込みアナライザーでは要件を満たすことができない特殊なシナリオに適しています。タブ文字(\t)は、フィールド値と検索クエリの単語を区切るために使用されます。フィールド値と検索クエリが同じ方法でセグメント化されていることを確認してください。そうでない場合、ドキュメントを取得できません。

使用上の注意: このアナライザーは、TEXTおよびSHORT_TEXTタイプのフィールドに適用されます。このアナライザーは、クエリ分析をサポートしていません。

:

If the value of a field is "菊\t花茶\thao" in a document and the simple analyzer is used, the document can be retrieved only when you search for "菊", "花茶", "菊\t花茶", "花茶\thao", "菊\thao", or "菊\t花茶\thao". //ドキュメント内のフィールドの値が「菊\t花茶\thao」で、シンプルアナライザーが使用されている場合、ドキュメントは「菊」、「花茶」、「菊\t花茶」、「花茶\thao」、「菊\thao」、または「菊\t花茶\thao」を検索した場合にのみ取得できます。

数値アナライザー

説明: このアナライザーは、時間間隔または数値範囲に基づく検索に適しています。

使用上の注意: このアナライザーは、INTおよびTIMESTAMPタイプのフィールドに適用されます。

:

query=default:'OpenSearch' AND index:[number1,number2]
// この例では、indexは数値アナライザーが構成されているインデックスの名前です。

地理位置情報アナライザー

説明: このアナライザーは、地理的な場所に基づく検索に適しています。

使用上の注意: このアナライザーは、GEO_POINTタイプのフィールドに適用されます。

:

query=spatial_index:'circle(116.5806 39.99624, 1000)'
// 半径が数キロメートルである円内の地理的な場所をクエリします。

ITコンテンツアナライザー

説明: このアナライザーは、IT業界の技術コンテンツに適しています。このアナライザーは、業界固有のアナライザーです。汎用アナライザーと比較して、ITコンテンツアナライザーはIT関連のテキストを別の方法でセグメント化します。

使用上の注意: このアナライザーは、TEXTおよびSHORT_TEXTタイプのフィールドに適用されます。

:

Text: c++数组使用注意事项
General analyzer: c ++数组使用注意事项
IT content analyzer: c++数组使用注意事项 //テキスト:c++数组使用注意事项
//汎用アナライザー:c ++数组使用注意事项
//ITコンテンツアナライザー:c++数组使用注意事项

中国語向けEコマース汎用アナライザー

説明: このアナライザーは、Eコマース業界に適用できます。これは業界固有のアナライザーです。長年にわたって蓄積された業界経験とAlibaba DAMO Academyの自然言語処理(NLP)技術により、OpenSearchはEコマース業界専用のクエリ分析機能を提供し、業界のペインポイントを解決し、ニーズを満たします。

使用上の注意:

このアナライザーは、TEXTタイプのフィールドに適用されます。

このアナライザーは、Eコマース向け業界別拡張版の専用アプリケーションに固有です。

:

Text: 小金管遮瑕膏
General analyzer: 小金管 遮瑕膏
General analyzer for E-commerce for Chinese: 小金管 遮瑕 膏 //テキスト:小金管遮瑕膏
//汎用アナライザー:小金管 遮瑕膏
//中国語向けEコマース汎用アナライザー:小金管 遮瑕 膏

タイ語向け汎用アナライザー

説明: このアナライザーは、タイ語のテキストを検索単位ごとにセグメント化します。一般業界のタイ語テキスト分析に適用される汎用アナライザーです。

使用上の注意: このアナライザーは、TEXTおよびSHORT_TEXTタイプのフィールドに適用されます。

このアナライザーは、専用アプリケーションに固有です。

:

If the value of a field is "แหล่งดึงดูดนักท่องเที่ยว" in a document and the general analyzer for Thai is used, the analysis result is "แหล่ง ดึง ดูด นักท่องเที่ยว". In this case, the document can be retrieved when you search for "นักท่องเที่ยว" or "แหล่งดึงดูดนักท่องเที่ยว". //ドキュメント内のフィールドの値が「แหล่งดึงดูดนักท่องเที่ยว」で、タイ語向け汎用アナライザーが使用されている場合、分析結果は「แหล่ง ดึง ดูด นักท่องเที่ยว」になります。この場合、ドキュメントは「นักท่องเที่ยว」または「แหล่งดึงดูดนักท่องเที่ยว」を検索した場合に取得できます。

タイ語向けEコマースアナライザー

説明: このアナライザーは、Eコマース業界のタイ語テキスト分析に適用できます。

使用上の注意: このアナライザーは、TEXTおよびSHORT_TEXTタイプのフィールドに適用されます。

このアナライザーは、専用アプリケーションに固有です。

:

If the value of a field is "หน้าจอโทรศัพท์" in a document and the E-commerce analyzer for Thai is used, the analysis result is "หน้าจอ โทรศัพท์". In this case, the document can be retrieved when you search for "หน้าจอโทรศัพท์", "หน้าจอ", or "โทรศัพท์". //ドキュメント内のフィールドの値が「หน้าจอโทรศัพท์」で、タイ語向けEコマースアナライザーが使用されている場合、分析結果は「หน้าจอ โทรศัพท์」になります。この場合、ドキュメントは「หน้าจอโทรศัพท์」、「หน้าจอ」、または「โทรศัพท์」を検索した場合に取得できます。

ベトナム語向け汎用アナライザー

説明: このアナライザーは、一般業界のベトナム語テキスト分析に適用できます。

使用上の注意: このアナライザーは、TEXTおよびSHORT_TEXTタイプのフィールドに適用されます。

このアナライザーは、専用アプリケーションに固有です。

ゲーム向け汎用アナライザー

説明: このアナライザーは、ゲーム業界に適用できます。

使用上の注意: このアナライザーは、TEXTおよびSHORT_TEXTタイプのフィールドに適用されます。

このアナライザーは、ゲーム向け業界別拡張版の専用アプリケーションに固有です。

:

If the value of a field is "原神装备" in a document and the general analyzer for gaming is used, the analysis result is "原神 装备". In this case, the document can be retrieved when you search for "原神装备", "原神", or "装备". //ドキュメント内のフィールドの値が「原神装备」で、ゲーム向け汎用アナライザーが使用されている場合、分析結果は「原神 装备」になります。この場合、ドキュメントは「原神装备」、「原神」、または「装备」を検索した場合に取得できます。

英語向けEコマース汎用アナライザー

説明: このアナライザーは、Eコマース業界の英語テキスト分析に適用できます。

使用上の注意: このアナライザーは、TEXTタイプのフィールドにのみ適用されます。

このアナライザーは、Eコマース向け業界別拡張版の専用アプリケーションに固有です。

中国語向け文字アナライザー

説明: このアナライザーは、漢字、数字、英字、句読点に基づいてテキストをセグメント化します。このアナライザーは、中国語のセマンティクスに基づかない検索に適用できます。

使用上の注意: このアナライザーは、TEXTおよびSHORT_TEXTタイプのフィールドに適用されます。

このアナライザーは、専用アプリケーションに固有です。

:

If the value of a field is "开放搜索OpenSearch123." in a document and the character analyzer for Chinese is used, the document can be retrieved when you search for "开", "放", "搜", "索", "O", "p", "e", "n", "S", "e", "a", "r", "c", "h", or ".". //ドキュメント内のフィールドの値が「开放搜索OpenSearch123.」で、中国語向け文字アナライザーが使用されている場合、ドキュメントは「开」、「放」、「搜」、「索」、「O」、「p」、「e」、「n」、「S」、「e」、「a」、「r」、「c」、「h」、または「.」を検索した場合に取得できます。

韓国語向け汎用アナライザー

説明: このアナライザーは、一般業界の韓国語テキスト分析に適用できます。

使用上の注意: このアナライザーは、TEXTおよびSHORT_TEXTタイプのフィールドに適用されます。

このアナライザーは、専用アプリケーションに固有です。

:

If the value of a field is "인제군의교육" in a document and the general analyzer for Korean is used, the analysis result is "인제군 의 교육". In this case, the document can be retrieved when you search for "인제군의교육", "의", or "교육". //ドキュメント内のフィールドの値が「인제군의교육」で、韓国語向け汎用アナライザーが使用されている場合、分析結果は「인제군 의 교육」になります。この場合、ドキュメントは「인제군의교육」、「의」、または「교육」を検索した場合に取得できます。

韓国語向けEコマースアナライザー

説明: このアナライザーは、Eコマース業界の韓国語テキスト分析に適用できます。

使用上の注意: このアナライザーは、TEXTおよびSHORT_TEXTタイプのフィールドに適用されます。

このアナライザーは、専用アプリケーションに固有です。

:

If the value of a field is "스포츠캐주얼신발" in a document and the E-commerce analyzer for Korean is used, the analysis result is "스포츠 캐주얼 신발". In this case, the document can be retrieved when you search for "스포츠", "캐주얼", or "신발". //ドキュメント内のフィールドの値が「스포츠캐주얼신발」で、韓国語向けEコマースアナライザーが使用されている場合、分析結果は「스포츠 캐주얼 신발」になります。この場合、ドキュメントは「스포츠」、「캐주얼」、または「신발」を検索した場合に取得できます。

日本語向け汎用アナライザー

説明: このアナライザーは、一般業界の日本語テキスト分析に適用できます。

使用上の注意: このアナライザーは、TEXTおよびSHORT_TEXTタイプのフィールドに適用されます。

このアナライザーは、専用アプリケーションに固有です。

:

If the value of a field is "メキシコアグーチ" in a document and the general analyzer for Japanese is used, the analysis result is "メキシコ アグーチ". In this case, the document can be retrieved when you search for "メキシコ", or "アグーチ". //ドキュメント内のフィールドの値が「メキシコアグーチ」で、日本語向け汎用アナライザーが使用されている場合、分析結果は「メキシコ アグーチ」になります。この場合、ドキュメントは「メキシコ」、または「アグーチ」を検索した場合に取得できます。

日本語向けEコマースアナライザー

説明: このアナライザーは、Eコマース業界の日本語テキスト分析に適用できます。

使用上の注意: このアナライザーは、TEXTおよびSHORT_TEXTタイプのフィールドに適用されます。

このアナライザーは、専用アプリケーションに固有です。

:

If the value of a field is "ラウンドネックスーツ" in a document and the E-commerce analyzer for Japanese is used, the analysis result is "ラウンド ネック スーツ". In this case, the document can be retrieved when you search for "ラウンド", "ネック", or "スーツ". //ドキュメント内のフィールドの値が「ラウンドネックスーツ」で、日本語向けEコマースアナライザーが使用されている場合、分析結果は「ラウンド ネック スーツ」になります。この場合、ドキュメントは「ラウンド」、「ネック」、または「スーツ」を検索した場合に取得できます。

カスタムテキストアナライザー

説明: このアナライザーは、汎用アナライザー、Eコマースアナライザー、人名アナライザーなどの業界固有のアナライザーと、カスタム介入エントリを組み合わせたものです。詳細については、カスタムテキストアナライザーを参照してください。

使用上の注意: このアナライザーは、TEXTおよびSHORT_TEXTタイプのフィールドに適用されます。

アナライザーをテストする

業界固有のアナライザーまたはカスタムアナライザーをテストして、分析結果を確認できます。OpenSearch Industry Algorithm Editionコンソールにログインします。左側のナビゲーションペインで、[検索アルゴリズムセンター]>[検索設定]を選択します。[検索設定]ページの左側のペインで、[アナライザー管理]をクリックします。[アナライザー管理]ページで、テストするアナライザーを見つけて、[アクション]列の[分析テスト]をクリックします。[アナライザー効果テスト]パネルでアナライザーをテストします。次の図は例を示しています。

4

シナリオ

  • 中国語のセマンティクスに基づく検索のシナリオでは、中国語向け汎用アナライザーや中国語向けEコマースアナライザーなど、中国語向けのセマンティクスベースのアナライザーを使用することをお勧めします。

  • 短い中国語テキスト検索のシナリオ、または中国語のセマンティクスに基づかない検索のシナリオでは、厳密な並べ替えは必要ありません。このようなシナリオでは、中国語向け単一文字アナライザーを使用して、取得できるドキュメントの数を増やすことをお勧めします。

  • ピンインに基づく検索のシナリオでは、あいまい検索アナライザーを使用します。

  • 英語の検索のシナリオでは、英語向け語幹アナライザーを使用します。

  • 一部のシナリオでは、中国語向けのセマンティクスベースのアナライザーと中国語向け単一文字アナライザーを一緒に使用して、より良い検索結果を得ることができます。たとえば、次のクエリ文字列が使用されます。query=title_index:'菊花茶' OR sws_title_index:'菊花茶'。次の詳細ソート式が使用されます。text_relevance(title)*5+field_proximity(sws_title)。この例では、「xx菊xx花xx茶xx」を含むすべてのドキュメントを取得できます。さらに、「菊花茶」を含むドキュメントが最初にランク付けされます。

使用上の注意

  • 次のタイプのフィールドをインデックスフィールドとして構成できます。

    INT、INT_ARRAY、TEXT、SHORT_TEXT、LITERAL、LITERAL_ARRAY、TIMESTAMP、GEO_POINT

    次のタイプのフィールドは、インデックスフィールドとして構成できません。

    FLOAT、FLOAT_ARRAY、DOUBLE、DOUBLE_ARRAY

  • TEXTタイプのフィールドに検索結果の概要が構成されている場合、前の例のように拡張検索単位の一部の単語(「菊花茶」など)は、強調表示用のHTMLタグに追加されません。

  • 中国語向け単一文字アナライザーは、数字または英単語を単一文字と見なします。たとえば、ドキュメントに値が「hello word」のフィールドが含まれており、中国語向け単一文字アナライザーが使用されている場合、ドキュメントは「hello」を検索した場合に取得できます。ただし、ドキュメントは「he」を検索した場合には取得できません。英単語の一部を検索した場合にシステムがドキュメントを返すようにするには、あいまい検索アナライザーを使用します。

  • デフォルトでは、アプリケーションスキーマのプライマリテーブルのプライマリキーはインデックスフィールドとして構成され、インデックスフィールドの名前はidです。このインデックスフィールドは変更できません。

[Instruction unclear. Please provide the text to be translated.]