创建向量数据集。
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
调试
授权信息
|
操作 |
访问级别 |
资源类型 |
条件关键字 |
关联操作 |
|
gpdb:CreateCollection |
create |
*Collection
|
无 | 无 |
请求参数
|
名称 |
类型 |
必填 |
描述 |
示例值 |
| DBInstanceId |
string |
否 |
实例 ID。 说明
您可以调用 DescribeDBInstances 接口查看目标地域下所有的 AnalyticDB PostgreSQL 实例的实例 ID。 |
gp-bp152460513z**** |
| ManagerAccount |
string |
是 |
具有 rds_superuser 权限的管理账号名称。 说明
您可以调用 CreateAccount 接口创建账号。 |
testaccount |
| ManagerAccountPassword |
string |
是 |
管理账号密码。 |
testpassword |
| Namespace |
string |
否 |
命名空间。 说明
您可以通过 CreateNamespace 接口创建,通过 ListNamespaces 接口查看列表。 |
mynamespace |
| Collection |
string |
是 |
要创建的集合名。 说明
名称需符合 PostgreSQL 对象名限制。 |
document |
| Dimension |
integer |
否 |
向量维度。 说明
如果指定此值,会构建索引,且后续上传向量数据接口 UpsertCollectionData 的 Rows.Vector 长度需和此值一致。如果不指定此值,可以后续调用 CreateVectorIndex 构建索引。 |
1024 |
| FullTextRetrievalFields |
string |
否 |
用于全文检索的字段,多个字段用英文逗号(,)分隔,且字段必须属于 Metadata 里定义的 key。 |
title,content |
| Metadata |
string |
是 |
向量数据的元信息,为 MAP 格式的 JSON 字符串。其中 key 代表字段名,value 代表数据类型。 说明
支持的数据类型
警告 id、vector、to_tsvector、source 字段为保留字段,禁止使用。 |
{"title":"text","content":"text","response":"int"} |
| Parser |
string |
否 |
用于全文检索的分词器,默认为 zh_cn。 |
zh_cn |
| RegionId |
string |
是 |
实例所在地域 ID。 |
cn-hangzhou |
| Metrics |
string |
否 |
向量构建索引时的方法。取值说明:
|
cosine |
| HnswM |
integer |
否 |
HNSW 算法中的最大邻居数。接口会根据向量维度自动设置此值,一般不需要手动设置。 说明
取值范围:
说明
建议根据向量维度来设置:
|
64 |
| HnswEfConstruction |
string |
否 |
HNSW 算法构建索引时的候选集大小。取值需要>= 2*HNSW_M。 说明
取值范围:
|
128 |
| PqEnable |
integer |
否 |
索引是否开启 PQ(Product quantization)算法加速,数据量大于 50w 时建议开启。取值说明:
|
1 |
| ExternalStorage |
integer |
否 |
是否使用 mmap 构建 HNSW 索引,默认为 0。如果数据不需要删除,且对上传数据的速度性能有要求时,建议设置为 1。 取值说明:
重要 仅 6.0 版本支持参数 ExternalStorage。7.0 版本暂不支持。 |
0 |
| WorkspaceId |
string |
否 |
多数据库实例组成的 Workspace 的 Id。此参数和 DBInstanceId 参数不能同时为空,当和 DBInstanceId 同时指定时以此参数为准。 |
gp-ws-***** |
| MetadataIndices |
string |
否 |
标量索引字段,多个字段用英文逗号(,)分隔,且字段必须属于 Metadata 里定义的 key。 |
title |
| SupportSparse |
boolean |
否 |
是否支持稀疏向量。默认值:false。 |
true |
| SparseVectorIndexConfig |
object |
否 |
稀疏向量索引配置。如果传入,则创建稀疏向量索引。 |
|
| HnswM |
integer |
否 |
HNSW 算法中的最大邻居数。接口会根据向量维度自动设置此值,一般不需要手动设置。 说明
取值范围:
说明
建议根据向量维度来设置:
|
64 |
| HnswEfConstruction |
integer |
否 |
HNSW 算法构建索引时的候选集大小。取值范围:4~1000,默认值 64。 说明
仅 AnalyticDB PostgreSQL 7.0 版实例需要传该值,且取值需要>= 2*HNSW_M。 |
128 |
创建向量数据集成功后,您可参考 DescribeCollection 查看已创建的向量数据集。
返回参数
|
名称 |
类型 |
描述 |
示例值 |
|
object |
|||
| RequestId |
string |
请求 ID。 |
ABB39CC3-4488-4857-905D-2E4A051D0521 |
| Message |
string |
接口返回详细信息。 |
create successfully |
| Status |
string |
创建状态,取值说明:
|
success |
示例
正常返回示例
JSON格式
{
"RequestId": "ABB39CC3-4488-4857-905D-2E4A051D0521",
"Message": "create successfully",
"Status": "success"
}
错误码
访问错误中心查看更多错误码。
变更历史
更多信息,参考变更详情。