全部產品
Search
文件中心

OpenSearch:API 資料來源

更新時間:Jul 13, 2024

本文將介紹以API為資料來源時如何添加表。

添加表

  1. 執行個體詳情>表管理頁,點擊添加表

image.png

  1. 填寫表的基礎資訊,點擊下一步

image.png

配置說明

  • 表名稱:可自訂

  • 資料分區數:分區數設定時,請填寫不超過256的正整數, 用於提升全量構建速度、單次查詢效能。(部分存量執行個體,仍需各索引表分區數保持一致;或至少一個索引表分區數為1,其餘索引表分區數一致)

  • 資料更新資源數:資料更新所用資源數,每個索引預設免費提供2個4核8G的更新資源,超出免費額度的資源將產生費用,詳情可參考向量檢索版國際站計費文檔

  • 情境模板:向量檢索版內建了3種模板可供使用者選擇:通用、向量-圖片搜尋、向量-文本語義模板

  1. 資料同步,配置資料來源,點擊下一步

image.png

配置參數說明

  • 資料來源類型:選擇API推送資料來源,表示使用者的資料通過API的方式推送至執行個體中

  1. 欄位配置,配置完成後,點擊下一步:

image

說明
  • 必選欄位有:主鍵欄位和向量欄位,主鍵欄位為int或string類型並且需要勾選主鍵按鈕,向量欄位為float類型並且需要勾選向量欄位按鈕;

  • 向量欄位預設為多值的float類型,多值分隔字元預設使用ha3分割符^] 進行切分(其對應utf編碼為\x1D),也可以輸入自訂多值分隔字元

  • 當資料中缺少欄位或欄位為空白時,系統將自動補充預設值,數字類型預設補0,STRING類型預設補Null 字元串,支援自訂預設值

  1. 索引結構配置,配置完成後,點擊下一步:

image.png

此處主要針對向量索引進行配置:

  • 主鍵欄位、向量欄位必須填寫,命名空間欄位非必填,可以為空白。

  • 僅支援選擇固定的三個欄位,不支援新增。

  • 向量維度:根據模型產生的向量按需選擇

  • 向量距離:根據模型產生的向量按需選擇,系統支援的距離類型有兩種:SquareEuclidean和InnerProduct

  • 向量索引演算法:根據模型產生的向量按需選擇,系統支援的向量索引演算法有量化聚類(Quantized Clustering)linearHNSW(Hierarchical Navigable Small World)

  • 即時索引:表示API的增量資料是否需要即時構建向量索引,預設為true

其他進階配置,可點擊展開進行配置,參數說明可參考向量索引通用配置

image.png

  1. 確認建立,點擊確認建立後,系統將自動建立配置好的表:

image.png

可在變更歷史中查看建立表進度:

image.png

  1. 當表狀態在使用中時,即可在查詢測試頁面進行查詢測試:

image.png

注意事項

  • API資料來源索引重建時會將以前推送的資料清空,從指定的時間戳記開始追即時資料,所以API資料來源全量要謹慎。