通過OSS向量檢索,您可以基於語義內容、OSS中繼資料、多媒體中繼資料、對象ETag及標籤和自訂中繼資料等條件,快速定位海量Object中的目標檔案,最佳化檢索效率。
使用情境
個人及企業辦公情境
向量檢索可以通過特定語義內容直接對辦公檔案進行搜尋,例如直接搜尋“ERP 系統使用方式”、“IT 維修流程”、“2024 年經營情況分析”等關鍵詞,以實現檔案搜尋方式的便捷化,從而提升辦公效率。
多媒體社交情境
在多媒體社交情境中,您可以利用檢索能力,為您的使用者提供特定內容和多媒體資料檢索功能。例如,在某款社交應用程式中,使用者上傳了大量圖片資料。通過語義檢索,使用者可以直接根據內容進行圖片搜尋,比如直接搜尋內容為“郊外春遊”、“春節團聚”、“我見過的大海”等照片,從而為應用程式增加實用性和趣味性。
網盤情境
在網盤情境中,目前大多數提供基於標量檢索的檔案搜尋功能,例如按檔案名稱、建立時間或檔案尾碼進行搜尋。網盤通常應用於個人或企業情境,使用者可以利用向量檢索功能,對網盤中的特定內容進行搜尋,比如相關文檔或相簿中的相關圖片。
視頻監控情境
針對視頻監控儲存區的資料,企業可以利用向量檢索能力對監控資料中的部分檔案進行搜尋。比如輸入“雪天戶外監控”、“晴天中的果園”等關鍵詞,即可對相應檔案進行檢索。
注意事項
地區限制
華南3(廣州)地區的Bucket支援使用向量檢索功能。
Bucket限制
向量檢索支援檔案數量最多100億的Bucket。對於檔案數量不超過1億的Bucket,您可以直接啟用此功能;而當檔案數量超過1億時,請聯絡支援人員申請開通。
費用說明
向量檢索目前是公測階段。使用向量檢索功能會產生Object的中繼資料管理費用以及檢索次數費用,但公測期間暫不收費。關於向量檢索計費項目的更多資訊,請參見資料索引費用。
除向量檢索計費項目外,使用向量檢索還會產生API請求費用,按照API調用次數收費。涉及的API請求如下:
行為
API
次數
為Bucket中的檔案構建索引
HeadObject和GetObject
每個檔案調用1次
Bucket中檔案存在Tag
GetObjectTag
每個攜帶Tag的檔案調用1次
Bucket中檔案攜帶自訂Meta
GetObjectMeta
每個攜帶自訂Meta的檔案調用1次
Bucket中存在軟連結檔案
GetSymlink
每個攜帶軟連結的檔案調用1次
掃描Bucket中的檔案
ListObjects
每掃描1000個檔案調用1次
關於OSS API的請求費用,請參見請求費用。
建立索引所需時間
開啟向量檢索功能時,建立索引所需時間與Bucket記憶體量的檔案數量成正比。檔案數量越多,建立索引的時間越長。 一般來說,1000萬個檔案初次建立索引的時間約為1小時,10億個檔案初次建立索引的時間約為1天,100億個檔案初次建立索引的時間約為2~3天,該時間僅供參考。
分區上傳
對於通過分區上傳產生的Object,查詢結果中只顯示已通過CompleteMultipartUpload操作將片段(Part)合成的完整Object,不顯示已初始化但未完成(Complete)或者未中止(Abort)的片段。
操作步驟
使用OSS控制台
使用REST API
檢索條件和輸出設定
檢索條件設定
以下是完整的檢索條件,您可以根據需要設定單個或多個檢索條件。
結果輸出設定
您可對輸出結果進行排序和簡單統計。
對象排序方式:支援根據最後修改時間、檔案名稱和檔案大小進行升序、降序及預設排序。您可以按需選擇並排序檢索結果,便於快速找到所需檔案。
資料彙總:支援多種輸出類型,您可以對檢索結果進行去重統計、分組計數、最大值、最小值、平均值和求和等計算,便於高效分析和管理資料。
常見問題
為什麼檔案上傳後,無法立即檢索到?
檔案上傳後,對應檔案的索引產生需要一定時間,所以查詢結果會有一定程度的延遲,可能無法立即得到查詢結果,等待片刻後重試即可。