全部產品
Search
文件中心

OpenSearch:向量索引通用配置

更新時間:Nov 26, 2024

在配置表時索引結構部分可以對向量索引進行進階配置,以下將詳細說明這些進階版配置的參數含義。

在建立表時,第四步配置索引結構中,有關於向量索引的通用配置:

image.png

進階配置展開如下:

image.png

各配置說明如下:

配置

可選值

含義

向量維度

-

向量維度是指向量所具有的特徵或屬性的數量。向量維度大小決定了向量所能表達的資訊和特徵的複雜程度。向量維度配置需要根據使用者的向量模型產生的向量進行配置。

距離類型

  • 歐式距離(SquareEuclidean)

  • 內積距離(InnerProduct)

歐式距離向量得分越小越相關。

內積距離向量得分越大越相關。

向量索引演算法

  • Qc

  • HNSW

  • Linear

  • QGraph

詳情可參考:向量介紹

即時索引

  • true

  • false

選擇true則表示開啟即時索引,使用者通過API推送的即時資料,執行個體可即時構建向量,以供即時查詢。

即時索引參數

{"proxima.oswg.streamer.segment_size":2048}

建議保持預設值

即時檢索參數

-

不同的向量索引演算法該參數的配置方式不同,詳情可參考:

向量分隔字元

可自訂

向量檢索時各維度使用的分隔字元(如vector:'1.05066,0.15610,0.156145...' 其中分隔字元為逗號)

線性構建的閾值

預設為5000

表示資料量在5000以內用線性。

忽略有問題的向量資料

  • true

  • false

當向量維度不正常,向量資料為空白時,該參數配置為true,則不影響全量/批次增量資料的構建。