全部产品
Search
文档中心

云原生数据仓库AnalyticDB:CreateDocumentCollection - 创建文档库

更新时间:Feb 04, 2026

创建知识库。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

调试

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。

  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。

  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:

    • 对于必选的资源类型,用前面加 * 表示。

    • 对于不支持资源级授权的操作,用全部资源表示。

  • 条件关键字:是指云产品自身定义的条件关键字。

  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。

操作

访问级别

资源类型

条件关键字

关联操作

gpdb:CreateDocumentCollection

create

*Collection

acs:gpdb:{#regionId}:{#accountId}:collection/{#DBInstanceId}

请求参数

名称

类型

必填

描述

示例值

DBInstanceId

string

实例 ID。

说明

您可以调用 DescribeDBInstances 接口查看目标地域下所有的 AnalyticDB PostgreSQL 实例的详情,包括实例 ID。

gp-xxxxxxxxx

ManagerAccount

string

具有 rds_superuser 权限的管理账号名称。

说明

您可以通过控制台->账号管理来创建账号,或者通过 CreateAccount 接口创建。

testaccount

ManagerAccountPassword

string

管理账号密码。

testpassword

Namespace

string

命名空间,默认为 public。

说明

您可以通过 CreateNamespace 接口创建,通过 ListNamespaces 接口查看列表。

mynamespace

Collection

string

要创建的文档库名称。

说明

名称需符合 PostgreSQL 对象名限制。

document

RegionId

string

实例所在地域 ID。

cn-hangzhou

EmbeddingModel

string

向量化算法。默认值:text-embedding-v3。

说明

支持的算法:

  • text-embedding-v3(推荐,默认值): 1024 维、768 维、512 维

  • multimodal-embedding-v1(推荐):1024 维, 多模态向量算法

  • text-embedding-v1: 1536 维

  • text-embedding-v2: 1536 维

  • text2vec(不推荐): 1024 维

  • m3e-base(不推荐): 768 维

  • m3e-small(不推荐): 512 维

  • clip-vit-b-32(不推荐):CLIP ViT-B/32 模型, 512 维, 图片向量化算法

  • clip-vit-b-16(不推荐):CLIP ViT-B/16 模型, 512 维, 图片向量化算法

  • clip-vit-l-14(不推荐):CLIP ViT-L/14 模型, 768 维, 图片向量化算法

  • clip-vit-l-14-336px(不推荐):CLIP ViT-L/14@336px 模型, 768 维, 图片向量化算法

  • clip-rn50(不推荐):CLIP RN50 模型, 1024 维, 图片向量化算法

  • clip-rn101(不推荐):CLIP RN101 模型, 512 维, 图片向量化算法

  • clip-rn50x4(不推荐):CLIP RN50x4 模型, 640 维, 图片向量化算法

  • clip-rn50x16(不推荐):CLIP RN50x16 模型, 768 维, 图片向量化算法

  • clip-rn50x64(不推荐):CLIP RN50x64 模型, 1024 维, 图片向量化算法

text-embedding-v1

Dimension

integer

向量维度。默认值是向量化算法支持的维度。

1024

FullTextRetrievalFields

string

用于全文检索的字段,多个字段用英文逗号(,)分隔,且字段必须属于 Metadata 里定义的 key。

title,page

Metadata

string

向量数据的元信息,为 MAP 格式的 JSON 字符串。其中 key 代表字段名,value 代表数据类型。

说明

支持的数据类型

  • 数据类型列表详见:数据类型

  • 其中 money 类型暂不支持。

警告 id、vector、doc_name、content、loader_metadata、source、to_tsvector 字段为保留字段,禁止使用。

{"title":"text","page":"int"}

Parser

string

用于全文检索的分词器,默认为 zh_cn。

zh_cn

Metrics

string

向量构建索引时的方法

取值说明:

  • l2:欧氏距离。

  • ip:点积(内积)距离。

  • cosine(默认):余弦相似度。

cosine

HnswM

integer

HNSW 算法中的最大邻居数。接口会根据向量维度自动设置此值,一般不需要手动设置。

说明

取值范围:

  • AnalyticDB PostgreSQL 6.0 版实例:1~1000。

  • AnalyticDB PostgreSQL 7.0 版实例:2~100,默认值 16。

说明

建议根据向量维度来设置:

  • 小于等于 384:16

  • 大于 384 小于等于 768:32

  • 大于 768 小于等于 1024:64

  • 大于 1024:128

64

HnswEfConstruction

string

HNSW 算法构建索引时的候选集大小。取值范围:4~1000,默认值 64。

说明

仅 AnalyticDB PostgreSQL 7.0 版实例需要传该值,且取值需要>= 2*HNSW_M。

128

PqEnable

integer

索引是否开启 PQ(Product quantization)算法加速,数据量大于 50w 时建议开启。取值说明:

  • 0:关闭。

  • 1:开启(默认)。

1

ExternalStorage

integer

是否使用 mmap 构建 HNSW 索引,默认为 0。如果数据不需要删除,且对上传数据的速度性能有要求时,建议设置为 1。

取值说明:

  • 0:默认采用段页式存储构建索引,这种模式可以使用 PostgreSQL 中的 shared_buffer 做缓存,支持删除和更新等操作。

  • 1:该索引会采用 mmap 构建索引,该模式不支持删除更新等操作。

重要 仅 6.0 版本支持参数 ExternalStorage。7.0 版本暂不支持。

0

MetadataIndices

string

标量索引字段,多个字段用英文逗号(,)分隔,且字段必须属于 Metadata 里定义的 key。

title

EnableGraph

boolean

是否开启构建知识图谱。默认值:false。

说明

使用该参数前,实例必须升级到开启图引擎的版本。(公测期间请提工单升级版本)

true

LLMModel

string

LLM 模型名称。取值说明:

  • knowledge-extract-standard:默认值。

  • knowledge-extract-mini

说明

仅当开启构建知识图谱时,该参数生效。

knowledge-extract-standard

Language

string

构建知识图谱使用的语言。取值说明:

  • Simplified Chinese: 简体中文。默认值。

  • English:英语。

说明

仅当开启构建知识图谱时,该参数生效。

Simplified Chinese

EntityTypes

array

实体类型列表。

说明

当开启构建知识图谱时,该参数必传。

string

实体类型。

地点

RelationshipTypes

array

关系边类型列表。

说明

当开启构建知识图谱时,该参数必传。

string

关系边类型。

发生

SupportSparse

boolean

是否支持稀疏向量。默认值:false。

true

SparseVectorIndexConfig

object

稀疏向量索引配置。如果传入,则创建稀疏向量索引。

HnswM

integer

HNSW 算法中的最大邻居数。接口会根据向量维度自动设置此值,一般不需要手动设置。

说明

取值范围:

  • AnalyticDB PostgreSQL 6.0 版实例:1~1000。

  • AnalyticDB PostgreSQL 7.0 版实例:2~100,默认值 16。

说明

建议根据向量维度来设置:

  • 小于等于 384:16

  • 大于 384 小于等于 768:32

  • 大于 768 小于等于 1024:64

  • 大于 1024:128

64

HnswEfConstruction

integer

HNSW 算法构建索引时的候选集大小。取值范围:4~1000,默认值 64。

说明

仅 AnalyticDB PostgreSQL 7.0 版实例需要传该值,且取值需要>= 2*HNSW_M。

128

SparseRetrievalFields

string

用于构建稀疏向量的 metadata 字段,多个字段用英文逗号(,)分隔,且字段必须属于 Metadata 里定义的 key。

title,abstract

返回参数

名称

类型

描述

示例值

object

RequestId

string

请求 ID。

ABB39CC3-4488-4857-905D-2E4A051D0521

Message

string

返回信息。

Successful

Status

string

API 执行状态,取值如下:

  • success:执行成功。

  • fail:执行失败。

successs

示例

正常返回示例

JSON格式

{
  "RequestId": "ABB39CC3-4488-4857-905D-2E4A051D0521",
  "Message": "Successful",
  "Status": "successs"
}

错误码

访问错误中心查看更多错误码。

变更历史

更多信息,参考变更详情