全部產品
Search
文件中心

Tablestore:萬用字元查詢

更新時間:Sep 20, 2024

使用萬用字元查詢(WildcardQuery)可以實現模糊查詢,類似於資料庫中的Like文法,例如查詢文本中包含某個詞或短句的資料。

說明

如果要實現NOT LIKE功能,則WildcardQuery需要和BoolQuery中的mustNotQueries結合使用。更多資訊,請參見多條件組合查詢

功能概述

萬用字元查詢通過特定的符號實現模糊比對,能有效提升資料尋找的精確度與效率。

使用WildcardQuery功能查詢資料時,您可以使用帶有萬用字元的字串進行資料匹配。目前支援星號(*)和問號(?)兩種萬用字元。其中星號(*)代表任一字元序列,問號(?)代表任意單個字元。查詢字串支援以星號(*)或問號(?)開頭。例如查詢table*e,可以匹配到tablestore

目前支援用於WildcardQuery的資料類型包括Keyword和FuzzyKeyword。

  • Keyword類型:字串基礎資料類型,在中大規模資料上進行WildcardQuery等模糊查詢的效能較差,且效能會隨著資料規模增長而下降。

  • FuzzyKeyword類型:專門為WildcardQuery等模糊查詢功能最佳化過的資料類型,在小、中、大規模資料上的查詢效能均會更好更穩定,且效能基本不會隨著資料規模增長而下降。

為了滿足使用者不同情境的模糊比對需求,多元索引提供了3種不同類型的萬用字元查詢,具體說明請參見下表。

說明

本文主要介紹基於Keyword類型和FuzzyKeyword類型的WildcardQuery,如果想瞭解基於Text類型實現模糊查詢的方案,請參見基於分詞的萬用字元查詢文檔。

資料類型

查詢方式

優勢

劣勢

Keyword

WildcardQuery

相容Elasticsearch的方式

隨著索引資料增多後查詢效能會變差

FuzzyKeyword

WildcardQuery

效能好且穩定,效能基本不會隨著資料規模增長而下降

資料會有部分膨脹

Text

MatchPhraseQuery

支援大小寫不敏感

資料會有部分膨脹

注意事項

不論是Keyword類型還是FuzzyKeyword類型,WildcardQuery中的查詢詞長度均不能超過32個字元。

介面

萬用字元查詢的介面為Search或者ParallelScan,具體的Query類型為WildcardQuery

參數

參數

描述

fieldName

列名稱。

value

帶有萬用字元的字串,字串長度不能超過32個字元。

query

設定查詢類型為WildcardQuery。

getTotalCount

是否返回匹配的總行數,預設為false,表示不返回。

返回匹配的總行數會影響查詢效能。

weight

查詢權重,用於全文檢索索引情境中的score排序。查詢時指定列的算分權重,值越大,結果中分數的值會越大。取值範圍為正浮點數。

使用此參數不會影響返回的結果數,只會影響返回的結果中的分數。

tableName

資料表名稱。

indexName

多元索引名稱。

columnsToGet

是否返回所有列,包含returnAll和columns設定。

returnAll預設為false,表示不返回所有列,此時可以通過columns指定返回的列;如果未通過columns指定返回的列,則只返回主鍵列。

當設定returnAll為true時,表示返回所有列。

使用方式

您可以使用控制台、命令列工具或者SDK進行萬用字元查詢。進行萬用字元查詢之前,您需要完成如下準備工作。

重要

目前基於FuzzyKeyword類型的WildcardQuery只支援使用Table StoreSDK實現。

  • 使用阿里雲帳號或者使用具有Table Store操作許可權的RAM使用者進行操作。如果需要為RAM使用者授權Table Store操作許可權,請參見通過RAM Policy為RAM使用者授權進行配置。

    使用SDK方式和命令列工具方式進行操作時,如果當前無可用AccessKey,則需要為阿里雲帳號或者RAM使用者建立AccessKey。具體操作,請參見建立AccessKey

  • 已建立資料表。具體操作,請參見資料表操作

  • 已為資料表建立多元索引。具體操作,請參見建立多元索引

  • 使用SDK方式進行操作時,還需要完成初始化Client。具體操作,請參見初始化OTSClient

  • 使用命令列工具方式進行操作前,還需要完成下載並啟動命令列工具,然後配置接入執行個體資訊並選擇要操作的表。具體操作,請參見下載命令列工具啟動並配置接入資訊資料表操作

使用控制台

  1. 進入索引管理頁簽。

    1. 登入Table Store控制台

    2. 在頁面上方,選擇資源群組和地區。

    3. 概覽頁面,單擊執行個體名稱或在操作列單擊執行個體管理

    4. 執行個體詳情頁簽下的資料表列表頁簽,單擊資料表名稱或在操作列單擊索引管理

  2. 索引管理頁簽,單擊目標多元索引操作列的搜尋

  3. 查詢資料對話方塊,查詢資料。

    1. 系統預設返回所有列,如需顯示指定屬性列,關閉擷取所有列並輸入需要返回的屬性列,多個屬性列之間用半形逗號(,)隔開。

      說明

      系統預設會返回資料表的主鍵列。

    2. 根據需要選擇邏輯操作符為AndOr或者Not

      當選擇邏輯操作符為And時,返回滿足指定條件的資料。當選擇邏輯操作符為Or時,如果配置了單個條件,則返回滿足指定條件的資料;如果配置了多個條件,則返回滿足任意一個條件的資料。當選擇邏輯操作符為Not時,返回不滿足指定條件的資料。

    3. 選擇索引欄位,單擊添加

    4. 設定索引欄位的查詢類型為萬用字元查詢(WildcardQuery)和輸入帶萬用字元的值。

    5. 系統預設關閉排序功能,如需根據指定欄位對返回結果進行排序,開啟是否排序開關後,根據需要添加要進行排序的欄位並配置排序方式。

    6. 系統預設關閉統計功能,如需對指定欄位進行資料統計,開啟是否統計開關後,根據需要添加要進行統計的欄位和配置統計資訊。

  4. 單擊確定

    符合查詢條件的資料會顯示在索引管理頁簽中。

使用命令列工具

通過命令列工具執行search命令使用多元索引查詢資料。更多資訊,請參見多元索引

重要

目前命令列工具僅支援Keyword類型的WildcardQuery,不支援FuzzyKeyword類型。

  1. 執行search命令使用search_index多元索引查詢表中資料,並返回所有建立索引的列。

    search -n search_index --return_all_indexed
  2. 根據系統提示輸入查詢條件,樣本如下:

    {
        "Offset": -1,
        "Limit": 10,
        "Collapse": null,
        "Sort": null,
        "GetTotalCount": true,
        "Token": null,
        "Query": {
            "Name": "WildcardQuery",
            "Query": {
                "FieldName": "col_keyword",
                "Value": "hang*u"
            }
        }
    }

使用SDK

您可以通過Java SDKGo SDKPython SDKNode.js SDK.NET SDKPHP SDK使用萬用字元查詢。此處以Java SDK為例介紹萬用字元查詢的使用。

說明

實際使用時,不論是Keyword類型還是FuzzyKeyword類型,查詢語句是完全相同的,只是查詢列的類型不同。

以下樣本用於使用萬用字元查詢表中Col_Keyword列的值中匹配"hang*u"的資料。

/**
 * 使用萬用字元查詢,查詢表中Col_Keyword列的值中匹配"hang*u"的資料。
 * @param client
 */
private static void wildcardQuery(SyncClient client) {
    SearchQuery searchQuery = new SearchQuery();
    WildcardQuery wildcardQuery = new WildcardQuery(); //設定查詢類型為WildcardQuery。
    wildcardQuery.setFieldName("Col_Keyword");
    wildcardQuery.setValue("hang*u"); //wildcardQuery支援萬用字元。
    searchQuery.setQuery(wildcardQuery);
    //searchQuery.setGetTotalCount(true); //設定返回匹配的總行數。

    SearchRequest searchRequest = new SearchRequest("<TABLE_NAME>", "<SEARCH_INDEX_NAME>", searchQuery);
    //通過設定columnsToGet參數可以指定返回的列或返回所有列,如果不設定此參數,則預設只返回主鍵列。
    //SearchRequest.ColumnsToGet columnsToGet = new SearchRequest.ColumnsToGet();
    //columnsToGet.setReturnAll(true); //設定為返回所有列。
    //columnsToGet.setColumns(Arrays.asList("ColName1","ColName2")); //設定為返回指定列。
    //searchRequest.setColumnsToGet(columnsToGet);

    SearchResponse resp = client.search(searchRequest);
    //System.out.println("TotalCount: " + resp.getTotalCount()); //列印匹配到的總行數,非返回行數。
    System.out.println("Row: " + resp.getRows());
}

計費說明

使用多元索引查詢資料時會消耗讀輸送量。更多資訊,請參見多元索引計量計費

常見問題

相關文檔