创建知识库。
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
调试
授权信息
|
操作 |
访问级别 |
资源类型 |
条件关键字 |
关联操作 |
|
gpdb:CreateDocumentCollection |
create |
*Collection
|
无 | 无 |
请求参数
|
名称 |
类型 |
必填 |
描述 |
示例值 |
| DBInstanceId |
string |
是 |
实例 ID。 说明
您可以调用 DescribeDBInstances 接口查看目标地域下所有的 AnalyticDB PostgreSQL 实例的详情,包括实例 ID。 |
gp-xxxxxxxxx |
| ManagerAccount |
string |
是 |
具有 rds_superuser 权限的管理账号名称。 说明
您可以通过控制台->账号管理来创建账号,或者通过 CreateAccount 接口创建。 |
testaccount |
| ManagerAccountPassword |
string |
是 |
管理账号密码。 |
testpassword |
| Namespace |
string |
否 |
命名空间,默认为 public。 说明
您可以通过 CreateNamespace 接口创建,通过 ListNamespaces 接口查看列表。 |
mynamespace |
| Collection |
string |
是 |
要创建的文档库名称。 说明
名称需符合 PostgreSQL 对象名限制。 |
document |
| RegionId |
string |
是 |
实例所在地域 ID。 |
cn-hangzhou |
| EmbeddingModel |
string |
否 |
向量化算法。默认值:text-embedding-v3。 说明
支持的算法:
|
text-embedding-v1 |
| Dimension |
integer |
否 |
向量维度。默认值是向量化算法支持的维度。 |
1024 |
| FullTextRetrievalFields |
string |
否 |
用于全文检索的字段,多个字段用英文逗号(,)分隔,且字段必须属于 Metadata 里定义的 key。 |
title,page |
| Metadata |
string |
否 |
向量数据的元信息,为 MAP 格式的 JSON 字符串。其中 key 代表字段名,value 代表数据类型。 说明
支持的数据类型
警告 id、vector、doc_name、content、loader_metadata、source、to_tsvector 字段为保留字段,禁止使用。 |
{"title":"text","page":"int"} |
| Parser |
string |
否 |
用于全文检索的分词器,默认为 zh_cn。 |
zh_cn |
| Metrics |
string |
否 |
向量构建索引时的方法 取值说明:
|
cosine |
| HnswM |
integer |
否 |
HNSW 算法中的最大邻居数。接口会根据向量维度自动设置此值,一般不需要手动设置。 说明
取值范围:
说明
建议根据向量维度来设置:
|
64 |
| HnswEfConstruction |
string |
否 |
HNSW 算法构建索引时的候选集大小。取值范围:4~1000,默认值 64。 说明
仅 AnalyticDB PostgreSQL 7.0 版实例需要传该值,且取值需要>= 2*HNSW_M。 |
128 |
| PqEnable |
integer |
否 |
索引是否开启 PQ(Product quantization)算法加速,数据量大于 50w 时建议开启。取值说明:
|
1 |
| ExternalStorage |
integer |
否 |
是否使用 mmap 构建 HNSW 索引,默认为 0。如果数据不需要删除,且对上传数据的速度性能有要求时,建议设置为 1。 取值说明:
重要 仅 6.0 版本支持参数 ExternalStorage。7.0 版本暂不支持。 |
0 |
| MetadataIndices |
string |
否 |
标量索引字段,多个字段用英文逗号(,)分隔,且字段必须属于 Metadata 里定义的 key。 |
title |
| EnableGraph |
boolean |
否 |
是否开启构建知识图谱。默认值:false。 说明
使用该参数前,实例必须升级到开启图引擎的版本。(公测期间请提工单升级版本) |
true |
| LLMModel |
string |
否 |
LLM 模型名称。取值说明:
说明
仅当开启构建知识图谱时,该参数生效。 |
knowledge-extract-standard |
| Language |
string |
否 |
构建知识图谱使用的语言。取值说明:
说明
仅当开启构建知识图谱时,该参数生效。 |
Simplified Chinese |
| EntityTypes |
array |
否 |
实体类型列表。 说明
当开启构建知识图谱时,该参数必传。 |
|
|
string |
否 |
实体类型。 |
地点 |
|
| RelationshipTypes |
array |
否 |
关系边类型列表。 说明
当开启构建知识图谱时,该参数必传。 |
|
|
string |
否 |
关系边类型。 |
发生 |
|
| SupportSparse |
boolean |
否 |
是否支持稀疏向量。默认值:false。 |
true |
| SparseVectorIndexConfig |
object |
否 |
稀疏向量索引配置。如果传入,则创建稀疏向量索引。 |
|
| HnswM |
integer |
否 |
HNSW 算法中的最大邻居数。接口会根据向量维度自动设置此值,一般不需要手动设置。 说明
取值范围:
说明
建议根据向量维度来设置:
|
64 |
| HnswEfConstruction |
integer |
否 |
HNSW 算法构建索引时的候选集大小。取值范围:4~1000,默认值 64。 说明
仅 AnalyticDB PostgreSQL 7.0 版实例需要传该值,且取值需要>= 2*HNSW_M。 |
128 |
| SparseRetrievalFields |
string |
否 |
用于构建稀疏向量的 metadata 字段,多个字段用英文逗号(,)分隔,且字段必须属于 Metadata 里定义的 key。 |
title,abstract |
返回参数
|
名称 |
类型 |
描述 |
示例值 |
|
object |
|||
| RequestId |
string |
请求 ID。 |
ABB39CC3-4488-4857-905D-2E4A051D0521 |
| Message |
string |
返回信息。 |
Successful |
| Status |
string |
API 执行状态,取值如下:
|
successs |
示例
正常返回示例
JSON格式
{
"RequestId": "ABB39CC3-4488-4857-905D-2E4A051D0521",
"Message": "Successful",
"Status": "successs"
}
错误码
访问错误中心查看更多错误码。
变更历史
更多信息,参考变更详情。