全部產品
Search
文件中心

:短語匹配查詢

更新時間:Jul 03, 2024

短語匹配查詢(MatchPhraseQuery)類似於匹配查詢(MatchQuery),但是分詞後多個詞的位置關係會被考慮,只有分詞後的多個詞在行資料中以同樣的順序和位置存在時,才表示行資料滿足查詢條件。如果查詢列的分詞類型為模糊分詞,則使用MatchPhraseQuery可以實現比WildcardQuery更快的模糊查詢。

前提條件

參數

參數

說明

field_name

要匹配的列。

匹配查詢可應用於Text類型。

text

查詢關鍵詞,即要匹配的值。

當要匹配的列為Text類型時,查詢關鍵詞會被分詞成多個詞,分詞類型為建立多元索引時設定的分詞器類型。如果建立多元索引時未設定分詞器類型,則預設分詞類型為單字分詞。

例如查詢的值為“this is”,可以匹配到“...,this is tablestore”、“this is a table”,但是無法匹配到“this table is ...”以及“is this a table”。

query

設定查詢類型為MatchPhraseQuery。

table_name

資料表名稱。

index_name

多元索引名稱。

limit

本次查詢需要返回的最大數量。

如果只為了擷取行數,無需擷取具體資料,可以設定limit=0,即不返回任意一行資料。

get_total_count

是否返回匹配的總行數,預設為False,表示不返回。

返回匹配的總行數會影響查詢效能。

columns_to_get

是否返回所有列。

  • 當設定return_type為ColumnReturnType.SPECIFIED時,可以通過column_names指定返回的列。

  • 當設定return_type為ColumnReturnType.ALL時,表示返回所有列。

  • 當設定return_type為ColumnReturnType.NONE時,表示不返回所有列,只返回主鍵列。

樣本

以下樣本用於查詢表中Col_Text列的值按照順序完整匹配'this is'短語的資料。

  • 5.2.1及之後版本

    使用5.2.1及之後的SDK版本時,預設的返回結果為SearchResponse對象,請求樣本如下:

    query = MatchPhraseQuery('Col_Text', 'this is')
    search_response = client.search(
        '<TABLE_NAME>', '<SEARCH_INDEX_NAME>', 
        SearchQuery(query, limit=100, get_total_count=True), 
        ColumnsToGet(return_type=ColumnReturnType.ALL)
    )
    print('request_id : %s' % search_response.request_id)
    print('is_all_succeed : %s' % search_response.is_all_succeed)
    print('total_count : %s' % search_response.total_count)
    print('rows : %s' % search_response.rows)
    
    # # 當需要進行深度翻頁時,推薦使用next_token進行翻頁(翻頁深度無限制)
    # all_rows = []
    # next_token = None
    # # first round
    # search_response = client.search(
    #     '<TABLE_NAME>', '<SEARCH_INDEX_NAME>',
    #     SearchQuery(query, next_token=next_token, limit=100, get_total_count=True),
    #     columns_to_get=ColumnsToGet(return_type=ColumnReturnType.ALL))
    # all_rows.extend(search_response.rows)
    # 
    # # loop
    # while search_response.next_token:
    #     search_response = client.search(
    #         '<TABLE_NAME>', '<SEARCH_INDEX_NAME>',
    #         SearchQuery(query, next_token=search_response.next_token, limit=100, get_total_count=True),
    #         columns_to_get=ColumnsToGet(return_type=ColumnReturnType.ALL))
    #     all_rows.extend(search_response.rows)
    # print('Total rows:%s' % len(all_rows))

    如果需要返回Tuple類型結果,您可以使用如下請求樣本實現。

    query = MatchPhraseQuery('Col_Text', 'this is')
    rows, next_token, total_count, is_all_succeed, agg_results, group_by_results = client.search(
        '<TABLE_NAME>', '<SEARCH_INDEX_NAME>', 
        SearchQuery(query, limit=100, get_total_count=True), 
        ColumnsToGet(return_type=ColumnReturnType.ALL)
    ).v1_response()
  • 5.2.1之前版本

    使用5.2.1之前的SDK版本時,預設的返回結果為Tuple類型,請求樣本如下:

    query = MatchPhraseQuery('Col_Text', 'this is')
    rows, next_token, total_count, is_all_succeed = client.search(
        '<TABLE_NAME>', '<SEARCH_INDEX_NAME>', 
        SearchQuery(query, limit=100, get_total_count=True), 
        ColumnsToGet(return_type=ColumnReturnType.ALL)
    )

常見問題

相關文檔