在配置表時索引結構部分可以對向量索引進行進階配置,以下將詳細說明這些進階版配置的參數含義。
在建立表時,第四步配置索引結構中,有關於向量索引的通用配置:
進階配置展開如下:
各配置說明如下:
配置 | 可選值 | 含義 |
向量維度 | - | 向量維度是指向量所具有的特徵或屬性的數量。向量維度大小決定了向量所能表達的資訊和特徵的複雜程度。向量維度配置需要根據使用者的向量模型產生的向量進行配置。 |
距離類型 |
| 歐式距離向量得分越小越相關 內積距離向量得分越大越相關 |
向量索引演算法 |
| 詳情可參考:向量介紹 |
即時索引 |
| 選擇true則表示開啟即時索引,使用者通過API推送的即時資料,執行個體可即時構建向量,以供即時查詢 |
即時索引參數 | {"proxima.oswg.streamer.segment_size":2048} | 建議保持預設值 |
即時檢索參數 | - | 不同的向量索引演算法該參數的配置方式不同,詳情可參考: |
向量分隔字元 | 可自訂 | 向量檢索時各維度使用的分隔字元(如vector:'1.05066,0.15610,0.156145...' 其中分隔字元為逗號) |
線性構建的閾值 | 預設為5000 | 表示資料量在5000以內用線性 |
忽略有問題的向量資料 |
| 當向量維度不正常,向量資料為空白時,該參數配置為true,則不影響全量/批次增量資料的構建 |