向量的高效能檢索依賴於向量索引,對執行個體的記憶體有一定要求,本文為您推薦常用的向量維度下,各資料量所對應的最小執行個體規格。
執行個體規格推薦
說明
下文為單表情境下的建議最小執行個體規格,推薦您按實際業務進行測試,根據實際需要的QPS和延遲,適當擴大執行個體規格。
如果您的向量資料行數更多,建議先按比例擴大執行個體規格進行測試。
如果您的向量檢索均為精確查詢,則無需建立向量索引,可以在下表的基礎上適當放寬執行個體規格要求進行測試。
向量維度 | 向量資料行數 | 建議最小執行個體規格 |
128 | 小於2億 | 32Core |
2億~4億 | 64Core | |
大於4億 | 128Core起 | |
256 | 小於6000萬 | 32Core |
6000萬~12000萬 | 64Core | |
大於12000萬 | 128Core起 | |
512 | 小於3000萬 | 32Core |
3000萬~6400萬 | 64Core | |
大於6400萬 | 128Core起 | |
768 | 小於2400萬 | 32Core |
2400萬~4800萬 | 64Core | |
大於4800萬 | 128Core起 | |
1024 | 小於1600萬 | 32Core |
1600萬~3200萬 | 64Core | |
大於3200萬 | 128Core起 | |
1536 | 小於1000萬 | 32Core |
1000萬~2000萬 | 64Core | |
大於2000萬 | 128Core起 |