旗舰模型
旗舰模型 | 通义千问-Max 适合复杂任务,推理能力最强 | 通义千问-Plus 效果、速度、成本均衡 | 通义千问-Turbo 适合简单任务,速度快、成本低 |
API调用模型名 (稳定版本) | qwen-max | qwen-plus | qwen-turbo |
最大上下文长度 (Token数) | 8,000 | 131,072 | 8,000 |
最低输入价格 (每千Token) | $0.0100 | $0.0030 | $0.0004 |
最低输出价格 (每千Token) | $0.0300 | $0.0090 | $0.0012 |
模型总览
类别 | 模型 | 说明 |
文本生成 | ||
向量 | 将文本转换成一组可以代表文字的数字,适用于搜索、聚类、推荐、分类任务。 |
文本生成-通义千问
以下是通义千问模型的商业版。相较于开源版,商业版具有最新的能力和改进。
通义千问-Max
通义千问系列效果最好的模型,适合复杂、多步骤的任务。如何使用 | API参考 | 在线体验
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 | 免费额度 |
(Token数) | (Token数) | ||||||
qwen-max | 稳定版 | 8,000 | 6,000 | 2,000 | $0.0100 | $0.0300 | 100万Token |
通义千问-Plus
能力均衡,推理效果、成本和速度介于通义千问-Max和通义千问-Turbo之间,适合中等复杂任务。如何使用 | API参考 | 在线体验
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 | 免费额度 |
(Token数) | (Token数) | ||||||
qwen-plus | 稳定版 | 131,072 | 128,000 | 8,192 | $0.0030 | $0.0090 | 100万Token |
通义千问-Turbo
通义千问系列速度最快、成本很低的模型,适合简单任务。如何使用 | API参考 | 在线体验
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 | 免费额度 |
(Token数) | (Token数) | ||||||
qwen-turbo | 稳定版 | 8,000 | 6,000 | 2,000 | $0.0004 | $0.0012 | 100万Token |
通义千问VL
通义千问VL是具有视觉(图像)理解能力的文本生成模型,不仅能进行OCR(图片文字识别),还能进一步总结和推理,例如从商品照片中提取属性,根据习题图进行解题等。如何使用 | API参考 | 在线体验
图像转换为Token的规则:512x512像素的图像约等于334个Token,其他分辨率图像按比例换算;最小单位是28x28像素,即每28x28像素对应一个Token,如果图像的长或宽不是28的整数倍,则向上取整至28的整数倍;一张图最少4个Token。
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 |
(Token数) | (Token数) | |||||
qwen-vl-max 相比qwen-vl-plus再次提升视觉推理和指令遵循能力,在更多复杂任务中提供最佳性能。 | 稳定版 | 7,500 | 6,000 单图最大1280 | 1,500 | 限时免费 | |
qwen-vl-plus 大幅提升细节识别和文字识别能力,支持超百万像素分辨率和任意宽高比的图像。在广泛的视觉任务中提供卓越性能。 | 稳定版 |
文本生成-通义千问-开源版
模型名称中,xxb表示参数规模,例如qwen2-72b-instruct表示参数规模为72B,即720亿。
百炼支持调用通义千问的开源版,您无需本地部署模型。对于开源版,建议使用Qwen2模型。
Qwen2
阿里云的通义千问2-开源版。如何使用 | API参考 | 在线体验
模型名称 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 |
(Token数) | (每千Token) | ||||
qwen2-72b-instruct | 131,072 | 128,000 | 6,144 | 限时免费 | |
qwen2-57b-a14b-instruct | 65,536 | 63,488 | |||
qwen2-7b-instruct | 131,072 | 128,000 |
Qwen1.5
阿里云的通义千问1.5-开源版。如何使用 | API参考 | 在线体验
模型名称 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 | 免费额度 |
(Token数) | (每千Token) | |||||
qwen1.5-110b-chat | 8,000 | 6,000 | 2,000 | 限时免费 | 100万Token | |
qwen1.5-72b-chat | ||||||
qwen1.5-32b-chat | ||||||
qwen1.5-14b-chat | ||||||
qwen1.5-7b-chat |
文本向量
文本向量模型用于将文本转换成一组可以代表文字的数字,适用于搜索、聚类、推荐、分类任务。模型根据输出Token数计费。API参考
模型名称 | 向量维度 | 最大行数 | 单行最大处理Token数 | 支持语种 | 单价 (每千Token) | 免费额度 |
text-embedding-v3 | 1024 768 512 | 6 | 8192 | 中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等50+语种 | 限时免费 | 50万Token |