全部产品
Search
文档中心

大模型服务平台百炼:模型介绍

更新时间:Dec 16, 2024

通用文本向量是一种人工智能技术,通过将文本转换为高维向量表示,捕捉其语义信息,从而支持文本相似度计算、分类和检索等多种自然语言处理任务。

模型介绍

通用文本向量,是通义实验室基于LLM底座的多语言文本统一向量模型,面向全球多个主流语种,提供高水准的向量服务,帮助开发者将文本数据快速转换为高质量的向量数据。

向量维度指的是向量中包含的元素数量。例如,一个 1024 维的向量包含 1024 个数值。维度越高,向量能表示的信息就越丰富,从而更细致地捕捉文本的特性。

模型中文名

模型英文名

向量维度

单次请求文本最大行数

单行最大输入token长度

支持语种

通用文本向量

text-embedding-v3

1024/768/512

6

8192

中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等50+语种

模型的效果数据

模型

MTEB

MTEB(Retrieval task)

CMTEB

CMTEB (Retrieval task)

text-embedding-v3(1024维度)

63.39

55.41

68.92

73.23

text-embedding-v3(768维度)

62.43

54.74

67.90

72.29

text-embedding-v3(512维度)

62.11

54.30

66.81

71.88