本文由簡體中文內容自動轉碼而成。阿里雲不保證此自動轉碼的準確性、完整性及時效性。本文内容請以簡體中文版本為準。

建立Collection

更新時間:2025-03-17 19:40

本文介紹向量檢索服務如何通過控制台、SDK、API三種不同的方式建立Collection。

控制台方式

  1. 登入向量檢索服務管理主控台

  2. 單擊Cluster列表,移動滑鼠到Cluster操作欄,單擊建立Collectionimage

  1. 填寫Collection名稱、選擇向量設定類型,填寫其他相關參數然後單擊確定按鈕,完成Collection的建立。建立Collection時,只能選擇單向量設定或多向量設定其中一種進行建立。

    1. 建立單向量Collectionimage建立Collection參數設定如下所示。

      參數

      對應API參數名稱

      說明

      是否必選

      參數

      對應API參數名稱

      說明

      是否必選

      Cluster

      ClusterName

      Cluster名稱

      Collection名稱

      Name

      待建立的Collection名稱。

      說明
      • 命名長度為3-32個字元。

      • 必須由大小寫字母、數字和符號(_,-)組成,且必須以字母開頭。

      • Collection名稱在Cluster內必須唯一,不允許兩個相同名稱的Collection同時存在。

      • 付費Cluster最多支援建立32個支援Collection;免費Cluster最多支援建立2個Collection。

      地區

      /

      當前支援杭州、北京、上海、深圳和張家口地區。

      Endpoint

      Endpoint

      vrs-cn-xxxxxxx.dashvector.cn-hangzhou.aliyuncs.com

      向量維度

      dimension

      向量維度,最小2,最大20000。

      說明
      • 向量的維度,指向量數組的大小。例如:[1.0,2.0,3.0] 為3維向量,[1.0,2.0,3.0,4.0] 為4維向量,依次類推。

      • 向量維度大小取決於使用模型輸出的向量維度。詳見什麼是向量

      向量資料類型

      dtype

      向量資料類型,指向量數組中元素的資料類型,向量檢索服務目前支援"Float"(預設)/"INT8"兩種資料類型。例如:[11,22,33,44] 則為INT8型,[1.1,2.2,3.3,4.4] 則為Float型。請根據業務實際情況選擇。

      距離度量方式

      metric

      距離度量方式,Cosine/"DotProduct"/"Euclidean"。為Cosine時,向量資料類型必須為Float。詳見什麼是向量

      Schema

      fields_schema

      詳見Schema Free

    2. 建立多向量Collection

      DashVector中一條記錄中可支援設定多條向量,並在搜尋過程中支援多條向量同時檢索。image

      說明
      • 一條Doc最多支援4條向量設定。

      • 點擊新增向量,下方會多出一條記錄。

      • 點擊右側刪除按鈕,本條記錄被刪除。

      建立Collection參數設定如下所示。

      參數

      對應API參數名稱

      說明

      是否必選

      參數

      對應API參數名稱

      說明

      是否必選

      Cluster

      ClusterName

      Cluster名稱

      Collection名稱

      Name

      待建立的Collection名稱。

      說明
      • 命名長度為3-32個字元。

      • 必須由大小寫字母、數字和符號(_,-)組成,且必須以字母開頭。

      • Collection名稱在Cluster內必須唯一,不允許兩個相同名稱的Collection同時存在。

      • 付費Cluster最多支援建立32個支援Collection;免費Cluster最多支援建立2個Collection。

      地區

      /

      當前支援杭州、北京、上海、深圳和張家口地區。

      Endpoint

      Endpoint

      vrs-cn-xxxxxxx.dashvector.cn-hangzhou.aliyuncs.com

      向量名稱

      {VectorName}

      自訂。需要滿足如下要求:

      • 命名長度為3-32個字元。

      • 必須由大小寫字母、數字和符號(_,-)組成。例如:vector1、vector_1、vector_a_name。

      • 向量名稱在本Collection中必須唯一,不允許兩個相同的向量名稱同時存在。

      說明
      • 向量名稱只能選擇建立Collection時填寫的向量名稱。

      向量維度

      dimension

      向量維度,最小2,最大20000。

      說明
      • 向量的維度,指向量數組的大小。例如:[1.0,2.0,3.0] 為3維向量,[1.0,2.0,3.0,4.0] 為4維向量,依次類推。

      • 向量維度大小取決於使用模型輸出的向量維度。詳見什麼是向量

      向量資料類型

      dtype

      向量資料類型,指向量數組中元素的資料類型,向量檢索服務目前支援"Float"(預設)/"INT8"兩種資料類型。例如:[11,22,33,44] 則為INT8型,[1.1,2.2,3.3,4.4] 則為Float型。請根據業務實際情況選擇。

      距離度量方式

      metric

      距離度量方式,Cosine/"DotProduct"/"Euclidean"。為Cosine時,向量資料類型必須為Float。詳見什麼是向量

      Schema

      fields_schema

      詳見Schema Free

SDK方式

  • 通過Python SDK建立一個新的Collection的方式,請參見建立Collection

  • 通過Java SDK建立一個新的Collection的方式,請參見建立Collection

API方式

通過HTTP API建立一個新的Collection的方式,請參見建立Collection

  • 本頁導讀 (1, M)
  • 控制台方式
  • SDK方式
  • API方式
文檔反饋