本文介紹向量檢索服務DashVector的產品規格,以協助使用者選擇貼合自身業務情境的執行個體規格。
執行個體類型
向量檢索服務DashVector當前支援三種執行個體(Cluster)類型,以支援不同的業務情境和需求:
效能型:適用於查詢QPS高、查詢延遲低的情境,同時效能型也是寫入效率最高的執行個體類型。對於高並發、大流量、低延遲情境,或對寫入效率有較高的要求的情境,可選擇效能型執行個體。
儲存型(推薦):儲存型相對於效能型有5倍的儲存容量優勢,能夠儲存和管理更多的向量資料,適用於大規模資料量的情境。儲存型執行個體同樣也具備優秀的技術指標,可滿足大部分情境需求,同時也是性價比最高的執行個體類型,推薦使用者選擇使用。
免費試用:適用於測試、體驗情境,請勿用於線上生產環境。免費試用執行個體有效期間為1個月,到期後可再次申請試用。免費執行個體有部分試用限制,詳情可參考約束與限制。
免費試用執行個體有效期間為1個月,到期後免費試用執行個體將自動釋放,執行個體中的資料將被全部刪除並清空且不可恢複,為了保證執行個體可持續使用,請您於建立免費試用執行個體之後的30個自然日內將免費試用執行個體升級為付費執行個體。免費試用執行個體由於到期且沒有升級為付費執行個體而導致的資料被刪除的情況,阿里雲將不承擔相關責任。
執行個體規格
向量檢索服務DashVector提供不同檔位的執行個體(Cluster)規格,不同規格的主要區別在於儲存容量的不同。
若您有更高規格需求,或有任何反饋、期望擷取更多支援人員,歡迎通過如下方式聯絡我們:
官方DingTalk群:25130022704
支援人員郵箱:dashvector@service.aliyun.com
儲存容量參考
執行個體類型 | 執行個體規格 | Doc容量參考(基於768維FP32向量資料) | Doc容量參考(基於1536維FP32向量資料) |
效能型 | P.small | 500,000 | 250,000 |
P.large | 1,000,000 | 500,000 | |
P.2xlarge | 2,000,000 | 1,000,000 | |
P.4xlarge | 4,000,000 | 2,000,000 | |
P.8xlarge | 8,000,000 | 4,000,000 | |
P.16xlarge | 16,000,000 | 8,000,000 | |
儲存型 | S.small | 2,500,000 | 1,250,000 |
S.large | 5,000,000 | 2,500,000 | |
S.2xlarge | 10,000,000 | 5,000,000 | |
S.4xlarge | 20,000,000 | 10,000,000 | |
S.8xlarge | 40,000,000 | 20,000,000 | |
S.16xlarge | 80,000,000 | 40,000,000 |
以上資料均已通過實際測實驗證,但僅供參考!
上述用於容量測試的Doc中不包含任何Fields,僅包含主鍵和向量資料,主鍵為從零開始自增正整數轉字串。大部分實際生產情境中,Fields是不可或缺的,Fields資料同樣會佔用儲存空間,從而導致實際儲存的Doc數低於上述表格。
檢索效能參考
執行個體類型 | 執行個體規格 | topk=10 | topk=100 | topk=250 | topk=1000 | ||||
QPS | RT_p99 | QPS | RT_p99 | QPS | RT_p99 | QPS | RT_p99 | ||
效能型 | P.large(基於1百萬768維FP32向量資料) | 962.6 | <30ms | 429.7 | <30ms | 387.5 | <45ms | 134.7 | <250ms |
儲存型 | S.large(基於5百萬768維FP32向量資料) | 297.6 | <30ms | 112.5 | <30ms | 107.4 | <50ms | 37.1 | <300ms |
以上資料為基於Cohere資料集實測結果,但由於不同資料集的資料分布對效能有影響,上述資料僅供參考。
上述用於效能測試的Doc中不包含任何Fields,僅包含主鍵和向量資料,主鍵為從零開始自增正整數轉字串。
向量檢索服務DashVector會定時在後台進行向量索引最佳化,通常在寫入完成後4小時完成,屆時效能達到最優狀態。
不同規格在寫滿資料情況下,QPS與上述表格中保持一致或更高,不因資料量的增加而下降。如,P.2xlarge規格,在寫滿2百萬768維FP32向量資料情況下,topk=100的QPS可達到600+。
副本數
向量檢索服務DashVector支援調整副本數,可選範圍為1-5。副本之間資料完全相同,副本數越大,可支援的QPS越高,呈線性關係。同時副本數越大,服務可用性越高,建議對可用性有較高要求的生產環境選擇>=2的副本數。
需要注意,副本數的增加和減少不會影響儲存容量,僅影響QPS和可用性。