在 OpenSearch 向量檢索版中,支援多種資料檢索方式,滿足多樣化的檢索需求。
混合檢索:結合使用傳統文本檢索與向量檢索,同時利用結構化和非結構化資料,提高搜尋結果的準確性。
向量檢索包含稠密向量和稀疏向量檢索,最終的分數是將稠密向量的距離和稀疏向量的距離加和得到的。使用歐式距離(SquareEuclidean)時,向量之間的距離越小表示相似性越高。
使用文本+向量混合檢索時,文本部分的得分是基於關鍵詞匹配度的,匹配度越高得分越高。最終綜合得分是將向量距離(越小越好)和文本得分(越高越好)加和得到的,這會導致綜合得分越大表示相關性越高。OpenSearch向量檢索版支援通過設定不同的權重平衡向量距離和文本得分的影響。例如減少向量距離的權重,增加文本得分的權重,以達到更好的檢索效果。
向量檢索:使用者將產生好的向量資料匯入到向量檢索版執行個體中,進行向量檢索的查詢。
單 Doc 多向量檢索:使用者在一個Doc中的某個向量欄位中儲存多個向量內容進行檢索。
多 Query 查詢:允許同時發送多個查詢請求,提高檢索效率和響應速度。
預測查詢:使用者將文本、圖片通過向量檢索版內建的向量化模型產生向量,並通過文本或圖片進行檢索的查詢方式。
主鍵查詢:通過唯一識別碼快速檢索特定文檔,確保高效的資料訪問。
Filter 運算式:利用過濾條件對查詢結果進行精確限制,最佳化資料篩選過程。
倒排索引:使用倒排索引結構加速全文檢索索引和快速定位相關文檔,提高查詢效能。