本文為您介紹向量檢索服務在電商智能搜尋和偏好推薦、自然語言處理等AI問答系統、圖庫類網站多模態搜尋、視頻檢索、分子檢測與篩選等情境下的應用。
電商智能搜尋和偏好推薦情境
在電商智能搜尋和偏好推薦情境中,向量資料庫可以實現基於向量相似性的搜尋和推薦功能。例如一個電商平台中包含了各種商品的映像和描述資訊,使用者在搜尋商品時,可以通過映像或者描述資訊查詢相關的商品,並且還希望能夠實現推薦功能,自動向使用者推薦可能感興趣的商品。
使用者只需要先將商品的映像和描述資訊使用Embedding技術轉換為向量表示,並將其儲存到向量資料庫中。當使用者輸入查詢請求時,向量檢索服務可以將其轉換為向量表示,然後計算查詢向量與向量資料庫中所有商品向量的相似性,然後返回相似性最高的幾個商品向量。另外,還可以基於使用者的歷史行為和偏好通過向量檢索服務將使用者的歷史瀏覽記錄和購買記錄轉化為向量表示,並在向量資料庫中查詢與該向量最相似以及相似性較高的商品向量,為使用者推薦可能感興趣的商品,提供更加智能和個人化的服務、更加高效和優秀的效能與購買體驗。
自然語言處理等AI問答系統情境
問答系統是屬於自然語言處理領域的常見現實應用。典型的問答系統比如通義千問、ChatGPT、線上客戶服務系統、QA聊天機器人等。例如在一個問答系統,其中包含了一些預定義的問題和對應的答案。使用者希望能夠根據輸入的問題,自動匹配到最相似的預定義問題,並返回對應的答案。為了實現此功能,首先可以通過向量檢索服務將預定義的問題和答案轉換為向量表示,並將其儲存到向量資料庫中。其次當使用者輸入問題時,向量檢索服務可以將其轉換為向量表示,並在向量資料庫中查詢與該向量最相似的問題向量。然後使用模型訓練、問答推理、後期最佳化等步驟,實作類別似通義千問、ChatGPT等的語言智能互動體系。
圖庫類網站多模態搜尋情境
當前大型的圖片素材網站和分享社交應用等,通常都有幾億甚至上百億的圖片量,只能提供簡單的文字搜尋或者單一的圖片搜尋方式,使用者無法快速地找到所需的圖片。而使用DashVector向量檢索服務,將圖片內容和文本描述以向量形式表示,並將其儲存到向量資料庫中。當使用者搜尋時,支援以文搜圖,圖搜圖以及文字+圖片組合搜尋精確過濾等多種模態的搜尋模式,將搜尋需求也通過向量表示,在向量資料庫中進行相似搜尋,協助使用者迅速找到想要的圖片,從而提升使用者體驗。
視頻檢索情境
在視頻檢索情境中,例如視頻監控系統、影視資源網站、短視頻應用等平台,其中包含了各種視頻資料。使用向量檢索服務通過將視頻資料轉換為向量表示,並將其儲存到向量資料庫中。當使用者看到一個電影片段或視頻截圖時,使用視頻相似性搜尋系統進行基於內容向量的視頻檢索,從而快速檢索出與查詢視頻最相似的視頻,並返回給使用者作為搜尋結果。同時還可以在向量資料庫中使用基於聚類的視頻檢索方法,對視頻進行聚類,並在聚類之間進行快速檢索,提高檢索效率和準確度。
分子檢測與篩選情境
在分子檢測中,可以使用分子指紋(例如ECFP、MACCS鍵等)將分子結構轉換為向量表示,並將其儲存到向量資料庫中。當使用者輸入查詢請求時,可以使用同樣的方法將其轉換為向量表示,並在向量資料庫中查詢與該向量最相似的分子向量,並返回給使用者作為搜尋結果,實現基於分子結構相似性的分子檢索和篩選。為分子發現和藥物設計提供更加智能和高效的解決方案。