用自然语句从指定文档库检索向量和元数据。
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
调试
授权信息
|
操作 |
访问级别 |
资源类型 |
条件关键字 |
关联操作 |
|
gpdb:QueryContent |
create |
*Document
|
无 | 无 |
请求参数
|
名称 |
类型 |
必填 |
描述 |
示例值 |
| DBInstanceId |
string |
是 |
实例 ID。 说明
您可以调用 DescribeDBInstances 接口查看目标地域下所有的 AnalyticDB PostgreSQL 实例的详情,包括实例 ID。 |
gp-xxxxxxxxx |
| Namespace |
string |
否 |
命名空间,默认为 public。 说明
您可以通过 CreateNamespace 接口创建,通过 ListNamespaces 接口查看列表。 |
mynamespace |
| Collection |
string |
是 |
文档库名称。 说明
由 CreateDocumentCollection 接口创建。您可以调用 ListDocumentCollections 接口查看已经创建的文档库。 |
document |
| RegionId |
string |
是 |
实例所在的地域 ID。 |
cn-hangzhou |
| NamespacePassword |
string |
是 |
命名空间对应的密码。 说明
本值为 CreateNamespace 接口指定。 |
testpassword |
| Content |
string |
否 |
用于检索的文本内容。 |
ADBPG是什么? |
| Filter |
string |
否 |
要查询的数据的过滤条件,格式为 SQL 的 WHERE 格式。是一个返回布尔值(真或假)的表达式,条件可以是简单的比较运算符,如等于(=)、不等于(<>或!=)、大于(>), 小于(<)、大于等于(>=)、小于等于(<=),也可以是逻辑运算符(AND, OR, NOT)组合的更复杂的表达式,以及使用 IN、BETWEEN、LIKE 等关键字的条件。 说明
|
title = 'test' AND name like 'test%' |
| RecallWindow |
array |
否 |
召回窗口。当该值不为空时,增加返回检索结果的上下文。格式为 2 个元素的数组:List<A, B>,其中-10<=A<=0,0<=B<=10。 说明
|
|
|
integer |
否 |
召回窗口大小。 |
[-5, 5] |
|
| TopK |
integer |
否 |
返回 top 数量的结果。 |
10 |
| RerankFactor |
number |
否 |
重排因子。当该值不为空时,会对向量检索结果再做一次重排。取值范围:1<RerankFactor<=5。 说明
|
2 |
| UseFullTextRetrieval |
boolean |
否 |
(参数废弃)是否使用全文检索(双路召回)。默认为 false,仅采用向量检索。 |
true |
| Metrics |
string |
否 |
检索时的相似度算法。此值为空时则采用创建知识库时指定的算法,建议如无特殊需求不需设置。 说明
取值说明:
|
cosine |
| FileName |
string |
否 |
以图搜图场景中,待搜索的图片源文件名。 说明
图片文件必须带有文件后缀,当前支持的图片后缀:bmp、jpg、jpeg、png、 tiff。 |
test.jpg |
| FileUrl |
string |
否 |
以图搜图场景中,公网可访问的图片文件 URL 地址。 说明
图片文件必须带有文件后缀,当前支持的图片后缀:bmp、jpg、jpeg、png、tiff。 |
https://xx/myImage.jpg |
| IncludeVector |
boolean |
否 |
是否返回向量。默认为 false。 说明
|
true |
| HybridSearch |
string |
否 |
多路召回算法,默认为空(即直接将稠密向量和全文的分数比较并排序)。 可选值:
|
RRF |
| HybridSearchArgs |
object |
否 |
多路召回的算法参数。目前支持 RRF 和 Weight 两种。HybridPathsSetting 可以指定召回稠密向量(dense)、稀疏向量(sparse)和全文检索(fulltext),如果值为空,默认召回稠密向量(dense)和全文检索(fulltext)。
|
|
|
object |
否 |
多路召回的参数名。 |
||
|
any |
否 |
参数值。 |
{ "HybridPathsSetting": { "paths": "dense,fulltext" }, "RRF": { "k": 60 } } |
|
| IncludeMetadataFields |
string |
否 |
默认为空,表示要返回的 metadata 字段,多个字段用逗号分隔。 |
title,page |
| IncludeFileUrl |
boolean |
否 |
是否同步返回文档的链接地址,默认不返回。 |
false |
| UrlExpiration |
string |
否 |
返回图片 URL 的有效期。 说明
取值说明
|
7200s |
| GraphEnhance |
boolean |
否 |
是否开启知识图谱增强。默认值:false。 |
false |
| GraphSearchArgs |
object |
否 |
知识图谱检索参数。 |
|
| GraphTopK |
integer |
否 |
返回 top 数量的实体和关系边。默认值:60。 |
60 |
| OrderBy |
string |
否 |
默认为空,表示排序的依据字段。 字段必须属于 metadata 或表里的默认字段比如 id,格式支持: 单个字段,如 chunk_id; 多个字段,用逗号连接,如 block_id, chunk_id; 支持反序,如: block_id DESC, chunk_id DESC; |
created_at |
| Offset |
integer |
否 |
偏移量,用于分页查询 |
0 |
返回参数
|
名称 |
类型 |
描述 |
示例值 |
|
object |
|||
| RequestId |
string |
请求 ID。 |
ABB39CC3-4488-4857-905D-2E4A051D0521 |
| Message |
string |
返回信息。 |
success |
| Status |
string |
状态,取值如下:
|
success |
| Matches |
object |
||
| MatchList |
array<object> |
匹配到的列表。 |
|
|
array<object> |
单条记录。 |
||
| Id |
string |
向量数据的唯一 Id。 |
doca-1234 |
| Content |
string |
文本内容。 |
云原生数据仓库AnalyticDB PostgreSQL版提供简单、快速、经济高效的PB级云端数据仓库解决方案。 |
| Metadata |
object |
元数据 Map。 |
|
|
string |
元数据。 |
{"title":"test"} |
|
| Vector |
object |
||
| VectorList |
array |
向量数据 List。 |
|
|
number |
向量数据。 |
[1.2123,-0.12314,...] |
|
| FileName |
string |
文件名。 |
my_doc.txt |
| Score |
number |
此条数据的相似度分数,其分数算法和创建索引时指定的算法(l2/ip/cosine)相关。 |
0.12345 |
| RetrievalSource |
integer |
检索结果的来源。1 表示向量检索,2 表示全文检索,3 表示双路召回。 |
1 |
| LoaderMetadata |
string |
文档加载器加载时的元信息。 |
{"page_pos": 1} |
| FileURL |
string |
查询结果图片的公网 URL 地址,有效时长默认为 2 小时。 可通过入参 UrlExpiration 自行指定有效时长 |
https://xxx-cn-beijing.aliyuncs.com/image/test.png |
| RerankScore |
number |
重排分数。 |
6.2345 |
| WindowMatches |
object |
||
| windowMatches |
array<object> |
窗口化匹配到的列表。 |
|
|
array<object> |
|||
| WindowMatch |
object |
||
| windowMatch |
array<object> |
单个 top 窗口化匹配到的列表。 |
|
|
array<object> |
|||
| Id |
string |
向量数据的唯一 ID。 |
doca-2345 |
| Content |
string |
文本内容。 |
云原生数据仓库AnalyticDB PostgreSQL版是一种大规模并行处理(MPP)数据仓库服务,可提供海量数据在线分析服务。 |
| Metadata |
object |
元数据 Map。 |
|
|
string |
元数据。 |
{"title":"test"} |
|
| FileName |
string |
文件名。 |
my_doc.txt |
| LoaderMetadata |
string |
文档加载器加载时的元信息。 |
{"page_pos": 2} |
| EmbeddingTokens |
string |
向量化时使用的 token 数。 说明
token 是指将输入的文本分割成的最小单位;token 可以是一个单词、一个词组、一个标点符号、一个字符等。 |
100 |
| Usage |
object |
本次查询的资源使用量 |
|
| EmbeddingTokens |
string |
向量化时使用的 token 数。 说明
token 是指将输入的文本分割成的最小单位;token 可以是一个单词、一个词组、一个标点符号、一个字符等。 |
100 |
| EmbeddingEntries |
string |
向量化时使用的条目数。 说明
条目是指对文字、图片做向量化处理时的处理数目,如对文字做一次处理,条目数是 1,对图片做一次处理是 2。 |
10 |
| Entities |
object |
||
| entities |
array<object> |
实体列表。 |
|
|
object |
实体详情。 |
||
| Id |
string |
实体 Id。 |
1 |
| Entity |
string |
实体名称。 |
Dr. Wang |
| Type |
string |
实体类型。 |
人物 |
| Description |
string |
实体描述。 |
A former advisor at DeepMind. |
| FileName |
string |
文件名。 |
my_doc.txt |
| Relations |
object |
||
| relations |
array<object> |
关系边列表。 |
|
|
object |
关系边详情。 |
||
| Id |
string |
关系边 Id。 |
1 |
| SourceEntity |
string |
源实体。 |
DeepMind前顾问 |
| TargetEntity |
string |
目标实体。 |
Dr. Wang |
| Description |
string |
关系边描述。 |
Dr. Wang previously served as an advisor at DeepMind. |
| FileName |
string |
文件名。 |
my_doc.txt |
示例
正常返回示例
JSON格式
{
"RequestId": "ABB39CC3-4488-4857-905D-2E4A051D0521",
"Message": "success",
"Status": "success",
"Matches": {
"MatchList": [
{
"Id": "doca-1234",
"Content": "云原生数据仓库AnalyticDB PostgreSQL版提供简单、快速、经济高效的PB级云端数据仓库解决方案。",
"Metadata": {
"key": "{\"title\":\"test\"}"
},
"Vector": {
"VectorList": [
0
]
},
"FileName": "my_doc.txt",
"Score": 0.12345,
"RetrievalSource": 1,
"LoaderMetadata": "{\"page_pos\": 1}",
"FileURL": "https://xxx-cn-beijing.aliyuncs.com/image/test.png",
"RerankScore": 6.2345
}
]
},
"WindowMatches": {
"windowMatches": [
{
"WindowMatch": {
"windowMatch": [
{
"Id": "doca-2345",
"Content": "云原生数据仓库AnalyticDB PostgreSQL版是一种大规模并行处理(MPP)数据仓库服务,可提供海量数据在线分析服务。",
"Metadata": {
"key": "{\"title\":\"test\"}"
},
"FileName": "my_doc.txt",
"LoaderMetadata": "{\"page_pos\": 2}"
}
]
}
}
]
},
"EmbeddingTokens": "100",
"Usage": {
"EmbeddingTokens": "100",
"EmbeddingEntries": "10"
},
"Entities": {
"entities": [
{
"Id": "1",
"Entity": "Dr. Wang",
"Type": "人物",
"Description": "A former advisor at DeepMind.",
"FileName": "my_doc.txt"
}
]
},
"Relations": {
"relations": [
{
"Id": "1",
"SourceEntity": "DeepMind前顾问",
"TargetEntity": "Dr. Wang",
"Description": "Dr. Wang previously served as an advisor at DeepMind.",
"FileName": "my_doc.txt\n"
}
]
}
}
错误码
访问错误中心查看更多错误码。
变更历史
更多信息,参考变更详情。