全部产品
Search
文档中心

大模型服务平台百炼:模型调用价格

更新时间:Feb 04, 2026

文本生成-通义千问

通义千问Max

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费;若模型支持上下文缓存,仅输入Token享有折扣。两者不能同时生效。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

免费额度(注)

qwen3-max

Batch调用半价
上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

$1.2

$6

各100万Token

有效期:阿里云百炼开通后90天内

32K<Token≤128K

$2.4

$12

128K<Token≤252K

$3

$15

qwen3-max-2026-01-23

非思考和思考模式

0<Token≤32K

$1.2

$6

32K<Token≤128K

$2.4

$12

128K<Token≤252K

$3

$15

qwen3-max-2025-09-23

仅非思考模式

0<Token≤32K

$1.2

$6

32K<Token≤128K

$2.4

$12

128K<Token≤252K

$3

$15

qwen3-max-preview

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

$1.2

$6

32K<Token≤128K

$2.4

$12

128K<Token≤252K

$3

$15

更多模型

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-max

Batch调用半价

仅非思考模式

无阶梯计价

$1.6

$6.4

各 100 万 Token
有效期:阿里云百炼开通后90天内

qwen-max-latest

仅非思考模式

无阶梯计价

$1.6

$6.4

qwen-max-2025-01-25

仅非思考模式

无阶梯计价

$1.6

$6.4

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

qwen3-max

上下文缓存享有折扣

仅非思考模式

0<Token≤32K

$1.2

$6

32K<Token≤128K

$2.4

$12

128K<Token≤252K

$3

$15

qwen3-max-2025-09-23

仅非思考模式

0<Token≤32K

$1.2

$6

32K<Token≤128K

$2.4

$12

128K<Token≤252K

$3

$15

qwen3-max-preview

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

$1.2

$6

32K<Token≤128K

$2.4

$12

128K<Token≤252K

$3

$15

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

qwen3-max

Batch调用半价
上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

$0.359

$1.434

32K<Token≤128K

$0.574

$2.294

128K<Token≤252K

$1.004

$4.014

qwen3-max-2026-01-23

非思考和思考模式

0<Token≤32K

$0.359

$1.434

32K<Token≤128K

$0.574

$2.294

128K<Token≤252K

$1.004

$4.014

qwen3-max-2025-09-23

仅非思考模式

0<Token≤32K

$0.861

$3.441

32K<Token≤128K

$1.434

$5.735

128K<Token≤252K

$2.151

$8.602

qwen3-max-preview

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

$0.861

$3.441

32K<Token≤128K

$1.434

$5.735

128K<Token≤252K

$2.151

$8.602

更多模型

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

qwen-max

仅非思考模式

无阶梯计价

$0.345

$1.377

qwen-max-latest

仅非思考模式

无阶梯计价

$0.345

$1.377

qwen-max-2025-01-25

仅非思考模式

无阶梯计价

$0.345

$1.377

qwen-max-2024-09-19

仅非思考模式

无阶梯计价

$2.868

$8.602

通义千问Plus

计费规则:按输入Token和输出Token计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

单次请求的输入Token范围

输入单价 (每百万Token)

输出单价 (每百万Token)

免费额度(注)

非思考模式

思考模式(思维链+回答)

qwen-plus

0<Token≤256K

$0.4

$1.2

$4

各 100 万 Token
有效期:阿里云百炼开通后90天内

256K<Token≤1M

$1.2

$3.6

$12

qwen-plus-latest

0<Token≤256K

$0.4

$1.2

$4

256K<Token≤1M

$1.2

$3.6

$12

qwen-plus-2025-12-01

0<Token≤256K

$0.4

$1.2

$4

256K<Token≤1M

$1.2

$3.6

$12

qwen-plus-2025-09-11

0<Token≤256K

$0.4

$1.2

$4

256K<Token≤1M

$1.2

$3.6

$12

qwen-plus-2025-07-28

0<Token≤256K

$0.4

$1.2

$4

256K<Token≤1M

$1.2

$3.6

$12

qwen-plus-2025-07-14

无阶梯计价

$0.4

$1.2

$4

qwen-plus-2025-04-28

无阶梯计价

$0.4

$1.2

$4

qwen-plus-2025-01-25

无阶梯计价

$0.4

$1.2

-

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

单次请求的输入Token范围

输入单价 (每百万Token)

输出单价 (每百万Token)

非思考模式

思考模式(思维链+回答)

qwen-plus

0<Token≤256K

$0.4

$1.2

$4

256K<Token≤1M

$1.2

$3.6

$12

qwen-plus-2025-12-01

0<Token≤256K

$0.4

$1.2

$4

256K<Token≤1M

$1.2

$3.6

$12

qwen-plus-2025-09-11

0<Token≤256K

$0.4

$1.2

$4

256K<Token≤1M

$1.2

$3.6

$12

qwen-plus-2025-07-28

0<Token≤256K

$0.4

$1.2

$4

256K<Token≤1M

$1.2

$3.6

$12

美国

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称

单次请求的输入Token范围

输入单价 (每百万Token)

输出单价 (每百万Token)

非思考模式

思考模式(思维链+回答)

qwen-plus-us

0<Token≤256K

$0.4

$1.2

$4

256K<Token≤1M

$1.2

$3.6

$12

qwen-plus-2025-12-01-us

0<Token≤256K

$0.4

$1.2

$4

256K<Token≤1M

$1.2

$3.6

$12

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

单次请求的输入Token范围

输入单价(每百万Token)

输出单价(每百万Token)

非思考模式

思考模式(思维链+回答)

qwen-plus

0<Token≤128K

$0.115

$0.287

$1.147

128K<Token≤256K

$0.345

$2.868

$3.441

256K<Token≤1M

$0.689

$6.881

$9.175

qwen-plus-latest

0<Token≤128K

$0.115

$0.287

$1.147

128K<Token≤256K

$0.345

$2.868

$3.441

256K<Token≤1M

$0.689

$6.881

$9.175

qwen-plus-2025-12-01

0<Token≤128K

$0.115

$0.287

$1.147

128K<Token≤256K

$0.345

$2.868

$3.441

256K<Token≤1M

$0.689

$6.881

$9.175

qwen-plus-2025-09-11

0<Token≤128K

$0.115

$0.287

$1.147

128K<Token≤256K

$0.345

$2.868

$3.441

256K<Token≤1M

$0.689

$6.881

$9.175

qwen-plus-2025-07-28

0<Token≤128K

$0.115

$0.287

$1.147

128K<Token≤256K

$0.345

$2.868

$3.441

256K<Token≤1M

$0.689

$6.881

$9.175

qwen-plus-2025-07-14

无阶梯计价

$0.115

$0.287

$1.147

qwen-plus-2025-04-28

无阶梯计价

$0.115

$0.287

$1.147

更多模型

模型名称

单次请求的输入Token范围

输入单价(每百万Token)

输出单价(每百万Token)

qwen-plus-2025-01-25

无阶梯计价

$0.115

$0.287

qwen-plus-2025-01-12

无阶梯计价

$0.115

$0.287

qwen-plus-2024-12-20

无阶梯计价

$0.115

$0.287

通义千问Flash

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费;若模型支持上下文缓存,仅输入Token享有折扣。两者不能同时生效。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

单次请求的输入Token范围

输入单价 (每百万Token)

输出单价 (每百万Token)

免费额度(注)

qwen-flash

Batch调用半价
上下文缓存享有折扣

0<Token≤256K

$0.05

$0.4

各 100 万 Token
有效期:阿里云百炼开通后90天内

256K<Token≤1M

$0.25

$2

qwen-flash-2025-07-28

0<Token≤256K

$0.05

$0.4

256K<Token≤1M

$0.25

$2

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

qwen-flash

上下文缓存享有折扣

0<Token≤256K

$0.05

$0.4

256K<Token≤1M

$0.25

$2

qwen-flash-2025-07-28

0<Token≤256K

$0.05

$0.4

256K<Token≤1M

$0.25

$2

美国

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称

单次请求的输入Token范围

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen-flash-us

0<Token≤256K

$0.05

$0.4

256K<Token≤1M

$0.25

$2

qwen-flash-2025-07-28-us

0<Token≤256K

$0.05

$0.4

256K<Token≤1M

$0.25

$2

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

qwen-flash

上下文缓存享有折扣

0<Token≤128K

$0.022

$0.216

128K<Token≤256K

$0.087

$0.861

256K<Token≤1M

$0.173

$1.721

qwen-flash-2025-07-28

0<Token≤128K

$0.022

$0.216

128K<Token≤256K

$0.087

$0.861

256K<Token≤1M

$0.173

$1.721

通义千问Turbo

说明

通义千问Turbo 后续不再更新,建议替换为通义千问Flash。

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

免费额度(注)

非思考模式

思考模式(思维链+回答)

qwen-turbo

Batch调用半价

$0.05

$0.2

$0.5

各100万Token
有效期:阿里云百炼开通后90天内

qwen-turbo-latest

$0.05

$0.2

$0.5

qwen-turbo-2025-04-28

$0.05

$0.2

$0.5

更多模型

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

免费额度(注)

qwen-turbo-2024-11-01

$0.05

$0.2

各100万Token
有效期:阿里云百炼开通后90天内

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

非思考模式

思考模式(思维链+回答)

qwen-turbo

$0.044

$0.087

$0.431

qwen-turbo-latest

$0.044

$0.087

$0.431

qwen-turbo-2025-07-15

$0.044

$0.087

$0.431

qwen-turbo-2025-04-28

$0.044

$0.087

$0.431

QwQ

计费规则:按输入Token和输出Token计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

免费额度(注)

qwq-plus

$0.8

$2.4

100万Token
有效期:阿里云百炼开通后90天内

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

qwq-plus

$0.230

$0.574

qwq-plus-latest

$0.230

$0.574

qwq-plus-2025-03-05

$0.230

$0.574

通义千问Long

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-long-latest

$0.072

$0.287

无免费额度

qwen-long-2025-01-25

$0.072

$0.287

通义千问Omni

计费规则:按输入Token和输出Token计费。不同模态的Token计算规则请参见计费与限流

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen3-omni-flash

非思考和思考模式

$0.43

$3.81

$0.78

$1.66

$3.06

$15.11

各100万Token(不区分模态)

有效期:阿里云百炼开通后90天内

qwen3-omni-flash-2025-12-01

非思考和思考模式

$0.43

$3.81

$0.78

$1.66

$3.06

$15.11

qwen3-omni-flash-2025-09-15

非思考和思考模式

$0.43

$3.81

$0.78

$1.66

$3.06

$15.11

更多模型

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen-omni-turbo

$0.07

$4.44

$0.21

$0.27

$0.63

$8.89

各100万Token(不区分模态)

有效期:阿里云百炼开通后90天内

qwen-omni-turbo-latest

$0.07

$4.44

$0.21

$0.27

$0.63

$8.89

qwen-omni-turbo-2025-03-26

$0.07

$4.44

$0.21

$0.27

$0.63

$8.89

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen3-omni-flash

非思考和思考模式

$0.258

$2.265

$0.473

$0.989

$1.821

$8.974

qwen3-omni-flash-2025-12-01

非思考和思考模式

$0.258

$2.265

$0.473

$0.989

$1.821

$8.974

qwen3-omni-flash-2025-09-15

非思考和思考模式

$0.258

$2.265

$0.473

$0.989

$1.821

$8.974

更多模型

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen-omni-turbo

$0.058

$3.584

$0.216

$0.230

$0.646

$7.168

qwen-omni-turbo-latest

$0.058

$3.584

$0.216

$0.230

$0.646

$7.168

qwen-omni-turbo-2025-03-26

$0.058

$3.584

$0.216

$0.230

$0.646

$7.168

qwen-omni-turbo-2025-01-19

$0.058

$3.584

$0.216

$0.230

$0.646

$7.168

通义千问Omni-Realtime

计费规则:按输入Token和输出Token计费。不同模态的Token计算规则请参见计费与限流

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen3-omni-flash-realtime

$0.52

$4.57

$0.94

$1.99

$3.67

$18.13

各100万Token(不区分模态)

有效期:阿里云百炼开通后90天内

qwen3-omni-flash-realtime-2025-12-01

$0.52

$4.57

$0.94

$1.99

$3.67

$18.13

qwen3-omni-flash-2025-09-15-realtime

$0.52

$4.57

$0.94

$1.99

$3.67

$18.13

qwen-omni-turbo-realtime

$0.270

$4.440

$0.840

$1.070

$2.520

$8.890

qwen-omni-turbo-realtime-latest

$0.270

$4.440

$0.840

$1.070

$2.520

$8.890

qwen-omni-turbo-realtime-2025-05-08

$0.270

$4.440

$0.840

$1.070

$2.520

$8.890

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

文本

音频

图片

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen3-omni-flash-realtime

$0.315

$2.709

$0.559

$1.19

$2.179

$10.766

qwen3-omni-flash-realtime-2025-12-01

$0.315

$2.709

$0.559

$1.19

$2.179

$10.766

qwen3-omni-flash-realtime-2025-09-15

$0.315

$2.709

$0.559

$1.19

$2.179

$10.766

qwen-omni-turbo-realtime

$0.230

$3.584

$0.861

$0.918

$2.581

$7.168

qwen-omni-turbo-realtime-latest

$0.230

$3.584

$0.861

$0.918

$2.581

$7.168

qwen-omni-turbo-realtime-2025-05-08

$0.230

$3.584

$0.861

$0.918

$2.581

$7.168

QVQ

计费规则:按输入Token和输出Token计费。不同模态的Token计算规则请参见计费与限流

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

免费额度(注)

qvq-max

$1.2

$4.8

各100万Token
有效期:阿里云百炼开通后90天内

qvq-max-latest

$1.2

$4.8

qvq-max-2025-03-25

$1.2

$4.8

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

qvq-max

$1.147

$4.588

qvq-max-latest

$1.147

$4.588

qvq-max-2025-05-15

$1.147

$4.588

qvq-max-2025-03-25

$1.147

$4.588

qvq-plus

$0.287

$0.717

qvq-plus-latest

$0.287

$0.717

qvq-plus-2025-05-15

$0.287

$0.717

通义千问VL

计费规则:按输入Token和输出Token计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

模式

单次请求的输入Token数

输入单价 (每百万Token)

输出单价 (每百万Token)

思维链+回答

免费额度(注)

qwen3-vl-plus

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

$0.2

$1.6

各100万Token
有效期:阿里云百炼开通后90天内

32K<Token≤128K

$0.3

$2.4

128K<Token≤256K

$0.6

$4.8

qwen3-vl-plus-2025-12-19

非思考和思考模式

0<Token≤32K

$0.2

$1.6

32K<Token≤128K

$0.3

$2.4

128K<Token≤256K

$0.6

$4.8

qwen3-vl-plus-2025-09-23

非思考和思考模式

0<Token≤32K

$0.2

$1.6

32K<Token≤128K

$0.3

$2.4

128K<Token≤256K

$0.6

$4.8

qwen3-vl-flash

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

$0.05

$0.4

32K<Token≤128K

$0.075

$0.6

128K<Token≤256K

$0.12

$0.96

qwen3-vl-flash-2026-01-22

非思考和思考模式

0<Token≤32K

$0.05

$0.4

32K<Token≤128K

$0.075

$0.6

128K<Token≤256K

$0.12

$0.96

qwen3-vl-flash-2025-10-15

非思考和思考模式

0<Token≤32K

$0.05

$0.4

32K<Token≤128K

$0.075

$0.6

128K<Token≤256K

$0.12

$0.96

更多模型

模型名称

单次请求的输入Token数

输入单价 (每百万Token)

输出单价 (每百万Token)

免费额度(注)

qwen-vl-max

上下文缓存享有折扣

无阶梯计价

$0.8

$3.2

各100万Token

有效期:阿里云百炼开通后90天内

qwen-vl-max-latest

无阶梯计价

$0.8

$3.2

qwen-vl-max-2025-08-13

无阶梯计价

$0.8

$3.2

qwen-vl-max-2025-04-08

无阶梯计价

$0.8

$3.2

qwen-vl-plus

上下文缓存享有折扣

无阶梯计价

$0.21

$0.63

qwen-vl-plus-latest

无阶梯计价

$0.21

$0.63

qwen-vl-plus-2025-08-15

无阶梯计价

$0.21

$0.63

qwen-vl-plus-2025-05-07

无阶梯计价

$0.21

$0.63

qwen-vl-plus-2025-01-25

无阶梯计价

$0.21

$0.63

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token数

输入单价 (每百万Token)

输出单价 (每百万Token)

思维链+回答

qwen3-vl-plus

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

$0.2

$1.6

32K<Token≤128K

$0.3

$2.4

128K<Token≤256K

$0.6

$4.8

qwen3-vl-plus-2025-09-23

非思考和思考模式

0<Token≤32K

$0.2

$1.6

32K<Token≤128K

$0.3

$2.4

128K<Token≤256K

$0.6

$4.8

qwen3-vl-flash

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

$0.05

$0.4

32K<Token≤128K

$0.075

$0.6

128K<Token≤256K

$0.12

$0.96

qwen3-vl-flash-2025-10-15

非思考和思考模式

0<Token≤32K

$0.05

$0.4

32K<Token≤128K

$0.075

$0.6

128K<Token≤256K

$0.12

$0.96

美国

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token数

输入单价 (每百万Token)

输出单价 (每百万Token)

思维链+回答

qwen3-vl-flash-us

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

$0.05

$0.4

32K<Token≤128K

$0.075

$0.6

128K<Token≤256K

$0.12

$0.96

qwen3-vl-flash-2025-10-15-us

非思考和思考模式

0<Token≤32K

$0.05

$0.4

32K<Token≤128K

$0.075

$0.6

128K<Token≤256K

$0.12

$0.96

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

模式

单次请求的输入Token数

输入单价 (每百万Token)

输出单价 (每百万Token)

思维链+回答

qwen3-vl-plus

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

$0.143

$1.434

32K<Token≤128K

$0.215

$2.15

128K<Token≤256K

$0.43

$4.301

qwen3-vl-plus-2025-12-19

非思考和思考模式

0<Token≤32K

$0.143

$1.434

32K<Token≤128K

$0.215

$2.15

128K<Token≤256K

$0.43

$4.301

qwen3-vl-plus-2025-09-23

非思考和思考模式

0<Token≤32K

$0.143

$1.434

32K<Token≤128K

$0.215

$2.15

128K<Token≤256K

$0.43

$4.301

qwen3-vl-flash

上下文缓存享有折扣

非思考和思考模式

0<Token≤32K

$0.022

$0.215

32K<Token≤128K

$0.043

$0.43

128K<Token≤256K

$0.086

$0.859

qwen3-vl-flash-2026-01-22

非思考和思考模式

0<Token≤32K

$0.022

$0.215

32K<Token≤128K

$0.043

$0.43

128K<Token≤256K

$0.086

$0.859

qwen3-vl-flash-2025-10-15

非思考和思考模式

0<Token≤32K

$0.022

$0.215

32K<Token≤128K

$0.043

$0.43

128K<Token≤256K

$0.086

$0.859

更多模型

模型名称

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

qwen-vl-max

上下文缓存享有折扣

无阶梯计价

$0.23

$0.574

qwen-vl-max-latest

无阶梯计价

$0.23

$0.574

qwen-vl-max-2025-08-13

无阶梯计价

$0.23

$0.574

qwen-vl-max-2025-04-08

无阶梯计价

$0.431

$1.291

qwen-vl-max-2025-04-02

无阶梯计价

$0.431

$1.291

qwen-vl-max-2025-01-25

无阶梯计价

$0.431

$1.291

qwen-vl-max-2024-12-30

无阶梯计价

$0.431

$1.291

qwen-vl-max-2024-11-19

无阶梯计价

$0.431

$1.291

qwen-vl-plus

上下文缓存享有折扣

无阶梯计价

$0.115

$0.287

qwen-vl-plus-latest

无阶梯计价

$0.115

$0.287

qwen-vl-plus-2025-08-15

无阶梯计价

$0.115

$0.287

qwen-vl-plus-2025-07-10

无阶梯计价

$0.022

$0.216

qwen-vl-plus-2025-05-07

无阶梯计价

$0.216

$0.646

qwen-vl-plus-2025-01-25

无阶梯计价

$0.216

$0.646

qwen-vl-plus-2025-01-02

无阶梯计价

$0.216

$0.646

通义千问OCR

计费规则:按输入Token和输出Token计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

免费额度(注)

qwen-vl-ocr

$0.07

$0.16

各100万Token
有效期:阿里云百炼开通后90天内

qwen-vl-ocr-2025-11-20

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

qwen-vl-ocr

$0.07

$0.16

qwen-vl-ocr-2025-11-20

$0.07

$0.16

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

qwen-vl-ocr

$0.043

$0.072

qwen-vl-ocr-latest

qwen-vl-ocr-2025-11-20

qwen-vl-ocr-2025-08-28

$0.717

$0.717

qwen-vl-ocr-2025-04-13

qwen-vl-ocr-2024-10-28

通义千问数学模型

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-math-plus

$0.574

$1.721

无免费额度

qwen-math-plus-latest

$0.574

$1.721

qwen-math-plus-2024-09-19

$0.574

$1.721

qwen-math-plus-2024-08-16

$0.574

$1.721

qwen-math-turbo

$0.287

$0.861

qwen-math-turbo-latest

$0.287

$0.861

qwen-math-turbo-2024-09-19

$0.287

$0.861

通义千问Coder

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持上下文缓存,仅输入Token享有折扣。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

单次请求的输入Token数

输入单价 (每百万Token)

输出单价 (每百万Token)

免费额度(注)

qwen3-coder-plus

上下文缓存享有折扣

0<Token≤32K

$1

$5

各100万Token
有效期:阿里云百炼开通后90天内

32K<Token≤128K

$1.8

$9

128K<Token≤256K

$3

$15

256K<Token≤1M

$6

$60

qwen3-coder-plus-2025-09-23

0<Token≤32K

$1

$5

32K<Token≤128K

$1.8

$9

128K<Token≤256K

$3

$15

256K<Token≤1M

$6

$60

qwen3-coder-plus-2025-07-22

0<Token≤32K

$1

$5

32K<Token≤128K

$1.8

$9

128K<Token≤256K

$3

$15

256K<Token≤1M

$6

$60

qwen3-coder-flash

0<Token≤32K

$0.3

$1.5

32K<Token≤128K

$0.5

$2.5

128K<Token≤256K

$0.8

$4

256K<Token≤1M

$1.6

$9.6

qwen3-coder-flash-2025-07-28

0<Token≤32K

$0.3

$1.5

32K<Token≤128K

$0.5

$2.5

128K<Token≤256K

$0.8

$4

256K<Token≤1M

$1.6

$9.6

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

qwen3-coder-plus

上下文缓存享有折扣

0<Token≤32K

$1

$5

32K<Token≤128K

$1.8

$9

128K<Token≤256K

$3

$15

256K<Token≤1M

$6

$60

qwen3-coder-plus-2025-09-23

0<Token≤32K

$1

$5

32K<Token≤128K

$1.8

$9

128K<Token≤256K

$3

$15

256K<Token≤1M

$6

$60

qwen3-coder-plus-2025-07-22

0<Token≤32K

$1

$5

32K<Token≤128K

$1.8

$9

128K<Token≤256K

$3

$15

256K<Token≤1M

$6

$60

qwen3-coder-flash

上下文缓存享有折扣

0<Token≤32K

$0.3

$1.5

32K<Token≤128K

$0.5

$2.5

128K<Token≤256K

$0.8

$4

256K<Token≤1M

$1.6

$9.6

qwen3-coder-flash-2025-07-28

0<Token≤32K

$0.3

$1.5

32K<Token≤128K

$0.5

$2.5

128K<Token≤256K

$0.8

$4

256K<Token≤1M

$1.6

$9.6

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

qwen3-coder系列模型

模型名称

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

qwen3-coder-plus

上下文缓存享有折扣

0<Token≤32K

$0.574

$2.294

32K<Token≤128K

$0.861

$3.441

128K<Token≤256K

$1.434

$5.735

256K<Token≤1M

$2.868

$28.671

qwen3-coder-plus-2025-09-23

0<Token≤32K

$0.574

$2.294

32K<Token≤128K

$0.861

$3.441

128K<Token≤256K

$1.434

$5.735

256K<Token≤1M

$2.868

$28.671

qwen3-coder-plus-2025-07-22

0<Token≤32K

$0.574

$2.294

32K<Token≤128K

$0.861

$3.441

128K<Token≤256K

$1.434

$5.735

256K<Token≤1M

$2.868

$28.671

qwen3-coder-flash

0<Token≤32K

$0.144

$0.574

32K<Token≤128K

$0.216

$0.861

128K<Token≤256K

$0.359

$1.434

256K<Token≤1M

$0.717

$3.584

qwen3-coder-flash-2025-07-28

0<Token≤32K

$0.144

$0.574

32K<Token≤128K

$0.216

$0.861

128K<Token≤256K

$0.359

$1.434

256K<Token≤1M

$0.717

$3.584

早期qwen-coder系列模型

模型名称

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

qwen-coder-plus

无阶梯计价

$0.502

$1.004

qwen-coder-plus-latest

无阶梯计价

$0.502

$1.004

qwen-coder-plus-2024-11-06

无阶梯计价

$0.502

$1.004

qwen-coder-turbo

无阶梯计价

$0.287

$0.861

qwen-coder-turbo-latest

无阶梯计价

$0.287

$0.861

qwen-coder-turbo-2024-09-19

无阶梯计价

$0.287

$0.861

通义千问翻译模型

计费规则:按输入Token和输出Token计费。

国际

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

免费额度(注)

qwen-mt-plus

$2.46

$7.37

各100万Token
有效期:阿里云百炼开通后90天内

qwen-mt-flash

$0.16

$0.49

qwen-mt-lite

$0.12

$0.36

qwen-mt-turbo

$0.16

$0.49

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

qwen-mt-plus

$2.46

$7.37

qwen-mt-flash

$0.16

$0.49

qwen-mt-lite

$0.12

$0.36

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

qwen-mt-plus

$0.259

$0.775

qwen-mt-flash

$0.101

$0.280

qwen-mt-lite

$0.086

$0.229

qwen-mt-turbo

$0.101

$0.280

通义千问数据挖掘模型

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-doc-turbo

$0.087

$0.144

无免费额度

通义千问深入研究模型

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-deep-research

$7.742

$23.367

文本生成-通义千问-开源版

Qwen3

计费规则:按输入Token和输出Token计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

非思考模式

思考模式

qwen3-next-80b-a3b-thinking

仅思考模式

$0.15

-

$1.2

各100万Token
有效期:阿里云百炼开通后90天内

qwen3-next-80b-a3b-instruct

仅非思考模式

$0.15

$1.2

-

qwen3-235b-a22b-thinking-2507

仅思考模式

$0.23

-

$2.3

qwen3-235b-a22b-instruct-2507

仅非思考模式

$0.23

$0.92

-

qwen3-30b-a3b-thinking-2507

仅思考模式

$0.2

-

$2.4

qwen3-30b-a3b-instruct-2507

仅非思考模式

$0.2

$0.8

-

qwen3-235b-a22b

非思考和思考模式

$0.7

$2.8

$8.4

qwen3-32b

非思考和思考模式

$0.16

$0.64

$0.64

qwen3-30b-a3b

非思考和思考模式

$0.2

$0.8

$2.4

qwen3-14b

非思考和思考模式

$0.35

$1.4

$4.2

qwen3-8b

非思考和思考模式

$0.18

$0.7

$2.1

qwen3-4b

非思考和思考模式

$0.11

$0.42

$1.26

qwen3-1.7b

非思考和思考模式

$0.11

$0.42

$1.26

qwen3-0.6b

非思考和思考模式

$0.11

$0.42

$1.26

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

非思考模式

思考模式(思维链+回答)

qwen3-next-80b-a3b-thinking

仅思考模式

$0.15

-

$1.2

qwen3-next-80b-a3b-instruct

仅非思考模式

$0.15

$1.2

-

qwen3-235b-a22b-thinking-2507

仅思考模式

$0.23

-

$2.3

qwen3-235b-a22b-instruct-2507

仅非思考模式

$0.23

$0.92

-

qwen3-30b-a3b-thinking-2507

仅思考模式

$0.2

-

$2.4

qwen3-30b-a3b-instruct-2507

仅非思考模式

$0.2

$0.8

-

qwen3-235b-a22b

非思考和思考模式

$0.7

$2.8

$8.4

qwen3-32b

非思考和思考模式

$0.16

$0.64

$0.64

qwen3-30b-a3b

非思考和思考模式

$0.2

$0.8

$2.4

qwen3-14b

非思考和思考模式

$0.35

$1.4

$4.2

qwen3-8b

非思考和思考模式

$0.18

$0.7

$2.1

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

非思考模式

思考模式(思维链+回答)

qwen3-next-80b-a3b-thinking

仅思考模式

$0.144

-

$1.434

qwen3-next-80b-a3b-instruct

仅非思考模式

$0.144

$0.574

-

qwen3-235b-a22b-thinking-2507

仅思考模式

$0.287

-

$2.868

qwen3-235b-a22b-instruct-2507

仅非思考模式

$0.287

$1.147

-

qwen3-30b-a3b-thinking-2507

仅思考模式

$0.108

-

$1.076

qwen3-30b-a3b-instruct-2507

仅非思考模式

$0.108

$0.431

-

qwen3-235b-a22b

非思考和思考模式

$0.287

$1.147

$2.868

qwen3-32b

非思考和思考模式

$0.287

$1.147

$2.868

qwen3-30b-a3b

非思考和思考模式

$0.108

$0.431

$1.076

qwen3-14b

非思考和思考模式

$0.144

$0.574

$1.434

qwen3-8b

非思考和思考模式

$0.072

$0.287

$0.717

qwen3-4b

非思考和思考模式

$0.044

$0.173

$0.431

qwen3-1.7b

非思考和思考模式

$0.044

$0.173

$0.431

qwen3-0.6b

非思考和思考模式

$0.044

$0.173

$0.431

QwQ-开源版

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwq-32b

$0.287

$0.861

无免费额度

QwQ-Preview

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwq-32b-preview

$0.287

$0.861

无免费额度

Qwen2.5

计费规则:按输入Token和输出Token计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

免费额度(注)

qwen2.5-14b-instruct-1m

$0.805

$3.22

各 100 万 Token
有效期:阿里云百炼开通后90天内

qwen2.5-7b-instruct-1m

$0.368

$1.47

qwen2.5-72b-instruct

$1.4

$5.6

qwen2.5-32b-instruct

$0.7

$2.8

qwen2.5-14b-instruct

$0.35

$1.4

qwen2.5-7b-instruct

$0.175

$0.7

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

qwen2.5-14b-instruct-1m

$0.144

$0.431

qwen2.5-7b-instruct-1m

$0.072

$0.144

qwen2.5-72b-instruct

$0.574

$1.721

qwen2.5-32b-instruct

$0.287

$0.861

qwen2.5-14b-instruct

$0.144

$0.431

qwen2.5-7b-instruct

$0.072

$0.144

qwen2.5-3b-instruct

$0.044

$0.130

qwen2.5-1.5b-instruct

限时免费

qwen2.5-0.5b-instruct

QVQ

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qvq-72b-preview

$1.721

$5.161

无免费额度

Qwen-Omni

计费规则:按输入Token和输出Token计费。不同模态的Token计算规则请参见计费与限流

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen2.5-omni-7b

$0.10

$6.76

$0.28

$0.40

$0.84

$13.51

100万Token(不区分模态)

有效期:阿里云百炼开通后90天

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

输入:文本

输入:音频

输入:图片/视频

输出:文本

仅纯文本输入

输出:文本

多模态输入

输出:文本+音频

仅音频计费

qwen2.5-omni-7b

$0.087

$5.448

$0.287

$0.345

$0.861

$10.895

Qwen3-Omni-Captioner

计费规则:按输入Token和输出Token计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen3-omni-30b-a3b-captioner

$3.81

$3.06

100万Token
有效期:阿里云百炼开通后90天内

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

qwen3-omni-30b-a3b-captioner

$2.265

$1.821

Qwen-VL

计费规则:按输入Token和输出Token计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

模式

输入单价 (每百万Token)

输出单价 (每百万Token)

思维链+回答

免费额度(注)

qwen3-vl-235b-a22b-thinking

仅思考模式

$0.4

$4

各100万Token
有效期:阿里云百炼开通后90天内

qwen3-vl-235b-a22b-instruct

仅非思考模式

$0.4

$1.6

qwen3-vl-32b-thinking

仅思考模式

$0.16

$0.64

qwen3-vl-32b-instruct

仅非思考模式

$0.16

$0.64

qwen3-vl-30b-a3b-thinking

仅思考模式

$0.2

$2.4

qwen3-vl-30b-a3b-instruct

仅非思考模式

$0.2

$0.8

qwen3-vl-8b-thinking

仅思考模式

$0.18

$2.1

qwen3-vl-8b-instruct

仅非思考模式

$0.18

$0.7

更多模型

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

免费额度(注)

qwen2.5-vl-72b-instruct

$2.8

$8.4

各100万Token
有效期:阿里云百炼开通后90天内

qwen2.5-vl-32b-instruct

$1.4

$4.2

qwen2.5-vl-7b-instruct

$0.35

$1.05

qwen2.5-vl-3b-instruct

$0.21

$0.63

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

模式

输入单价 (每百万Token)

输出单价 (每百万Token)

思维链+回答

qwen3-vl-235b-a22b-thinking

仅思考模式

$0.287

$2.867

qwen3-vl-235b-a22b-instruct

仅非思考模式

$0.287

$1.147

qwen3-vl-32b-thinking

仅思考模式

$0.287

$2.867

qwen3-vl-32b-instruct

仅非思考模式

$0.287

$1.147

qwen3-vl-30b-a3b-thinking

仅思考模式

$0.108

$1.075

qwen3-vl-30b-a3b-instruct

仅非思考模式

$0.108

$0.43

qwen3-vl-8b-thinking

仅思考模式

$0.072

$0.717

qwen3-vl-8b-instruct

仅非思考模式

$0.072

$0.287

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

模式

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

qwen3-vl-235b-a22b-thinking

仅思考模式

$0.287

$2.8677

qwen3-vl-235b-a22b-instruct

仅非思考模式

$0.287

$1.147

qwen3-vl-32b-thinking

仅思考模式

$0.287

$2.868

qwen3-vl-32b-instruct

仅非思考模式

$0.287

$1.147

qwen3-vl-30b-a3b-thinking

仅思考模式

$0.108

$1.076

qwen3-vl-30b-a3b-instruct

仅非思考模式

$0.108

$0.431

qwen3-vl-8b-thinking

仅思考模式

$0.072

$0.717

qwen3-vl-8b-instruct

仅非思考模式

$0.072

$0.287

更多模型

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

qwen2.5-vl-72b-instruct

$2.294

$6.881

qwen2.5-vl-32b-instruct

$1.147

$3.441

qwen2.5-vl-7b-instruct

$0.287

$0.717

qwen2.5-vl-3b-instruct

$0.173

$0.517

qwen2-vl-72b-instruct

$2.294

$6.881

qwen2-vl-7b-instruct

限时免费

qwen2-vl-2b-instruct

Qwen-Math

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen2.5-math-72b-instruct

$0.574

$1.721

无免费额度

qwen2.5-math-7b-instruct

$0.144

$0.287

qwen2.5-math-1.5b-instruct

限时免费

Qwen-Coder

计费规则:按输入Token和输出Token计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

单次请求的输入Token数

输入单价 (每百万Token)

输出单价 (每百万Token)

免费额度(注)

qwen3-coder-480b-a35b-instruct

0<Token≤32K

$1.5

$7.5

各100万Token
有效期:阿里云百炼开通后90天内

32K<Token≤128K

$2.7

$13.5

128K<Token≤200K

$4.5

$22.5

qwen3-coder-30b-a3b-instruct

0<Token≤32K

$0.45

$2.25

32K<Token≤128K

$0.75

$3.75

128K<Token≤200K

$1.2

$6

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

qwen3-coder-480b-a35b-instruct

0<Token≤32K

$1.5

$7.5

32K<Token≤128K

$2.7

$13.5

128K<Token≤200K

$4.5

$22.5

qwen3-coder-30b-a3b-instruct

0<Token≤32K

$0.45

$2.25

32K<Token≤128K

$0.75

$3.75

128K<Token≤200K

$1.2

$6

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

qwen3-coder-480b-a35b-instruct

0<Token≤32K

$0.861

$3.441

32K<Token≤128K

$1.291

$5.161

128K<Token≤200K

$2.151

$8.602

qwen3-coder-30b-a3b-instruct

0<Token≤32K

$0.216

$0.861

32K<Token≤128K

$0.323

$1.291

128K<Token≤200K

$0.538

$2.151

qwen2.5-coder-32b-instruct

无阶梯计价

$0.287

$0.861

qwen2.5-coder-14b-instruct

无阶梯计价

$0.287

$0.861

qwen2.5-coder-7b-instruct

无阶梯计价

$0.144

$0.287

qwen2.5-coder-3b-instruct

无阶梯计价

限时免费

qwen2.5-coder-1.5b-instruct

无阶梯计价

qwen2.5-coder-0.5b-instruct

无阶梯计价

文本生成-第三方模型

DeepSeek

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

deepseek-v3.2

上下文缓存享有折扣

$0.287

$0.431

无免费额度

deepseek-v3.2-exp

$0.287

$0.431

deepseek-v3.1

$0.574

$1.721

deepseek-r1

$0.574

$2.294

deepseek-r1-0528

$0.574

$2.294

deepseek-v3

$0.287

$1.147

deepseek-r1-distill-qwen-1.5b

限时免费

deepseek-r1-distill-qwen-7b

$0.072

$0.144

无免费额度

deepseek-r1-distill-qwen-14b

$0.144

$0.431

deepseek-r1-distill-qwen-32b

$0.287

$0.861

deepseek-r1-distill-llama-8b

限时免费

deepseek-r1-distill-llama-70b

限时免费

Kimi

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

kimi-k2.5

$0.574

$3.011

无免费额度

kimi-k2-thinking

$0.574

$2.294

Moonshot-Kimi-K2-Instruct

$0.574

$2.294

GLM

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称

模式

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

思维链和回答

glm-4.7

非思考和思考模式

0<Token≤32K

$0.431

$2.007

32K<Token≤166K

$0.574

$2.294

glm-4.6

非思考和思考模式

0<Token≤32K

$0.431

$2.007

32K<Token≤166K

$0.574

$2.294

图像生成

计费规则:输入不计费,输出计费。输出按成功生成的 图像张数 计费。

计费公式:费用 = 图像单价 × 输出的图像张数

计费说明:

  • 费用与输出图像的分辨率、宽高比无关。

  • 请求失败不产生任何费用,也不消耗免费额度。

计费示例:部分图像生成失败

假设图像单价为 $0.10/张。若您调用接口请求生成 4 张图像,但实际仅成功返回 3 张图像的 URL,另 1 张生成失败,系统将仅对成功生成的图像进行计费。

  • 计费数量:3 张。

  • 费用计算:0.1 × 3 = $0.3

通义千问文生图

仅输出计费,计费规则请参见图像生成

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输出单价

免费额度(注)

qwen-image-max

$0.075/张

各100张
有效期:阿里云百炼开通后90天内

qwen-image-max-2025-12-30

$0.075/张

qwen-image-plus

$0.03/张

qwen-image-plus-2026-01-09

$0.03/张

qwen-image

$0.035/张

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输出单价

qwen-image-max

$0.071677/张

qwen-image-max-2025-12-30

$0.071677/张

qwen-image-plus

$0.028671/张

qwen-image-plus-2026-01-09

$0.028671/张

qwen-image

$0.035/张

通义千问图像编辑

仅输出计费,计费规则请参见图像生成

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输出单价

免费额度(注)

qwen-image-edit-max

$0.075/张

各100张
有效期:阿里云百炼开通后90天内

qwen-image-edit-max-2026-01-16

$0.075/张

qwen-image-edit-plus

$0.03/张

qwen-image-edit-plus-2025-12-15

$0.03/张

qwen-image-edit-plus-2025-10-30

$0.03/张

qwen-image-edit

$0.045/张

通义千问图像翻译

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见图像生成

模型名称

输出单价

免费额度(注)

qwen-mt-image

$0.000431/张

无免费额度

通义-文生图-Z-Image

仅输出计费,计费规则请参见图像生成

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输出单价

免费额度(注)

z-image-turbo

关闭提示词改写(prompt_extend=false):$0.015/张

开启提示词改写(prompt_extend=true):$0.03/张

100张

有效期:阿里云百炼开通后90天内

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输出单价

z-image-turbo

关闭提示词改写(prompt_extend=false):$0.01434/张

开启提示词改写(prompt_extend=true):$0.02868/张

通义万相文生图

仅输出计费,计费规则请参见图像生成

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

输出单价

wan2.6-t2i

$0.03/张

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输出单价

免费额度(注)

wan2.6-t2i

$0.03/张

50张

wan2.5-t2i-preview

$0.03/张

50张

wan2.2-t2i-plus

$0.05/张

100张

wan2.2-t2i-flash

$0.025/张

100张

wan2.1-t2i-plus

$0.05/张

200张

wan2.1-t2i-turbo

$0.025/张

200张

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输出单价

wan2.6-t2i

$0.028671/张

wan2.5-t2i-preview

$0.028671/张

wan2.2-t2i-plus

$0.020070/张

wan2.2-t2i-flash

$0.028671/张

wanx2.1-t2i-plus

$0.028671/张

wanx2.1-t2i-turbo

$0.020070/张

wanx2.0-t2i-turbo

$0.005735/张

通义万相图像生成与编辑

仅输出计费,计费规则请参见图像生成

全球(弗吉尼亚)

说明

全球(弗吉尼亚)模型无免费额度。

模型名称

输出单价

wan2.6-image

$0.03/张

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输出单价

免费额度(注)

wan2.6-image

$0.03/张

50张
有效期:阿里云百炼开通后90天内

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输出单价

wan2.6-image

$0.028671/张

通义万相通用图像编辑

仅输出计费,计费规则请参见图像生成

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型服务

模型名称

输出单价

免费额度(注)

通用图像编辑2.5

wan2.5-i2i-preview

$0.03/张

50张
有效期:阿里云百炼开通后90天内

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型服务

模型名称

输出单价

通用图像编辑2.5

wan2.5-i2i-preview

$0.028671/张

通用图像编辑2.1

wanx2.1-imageedit

$0.020070/张

AI试衣-OutfitAnyone

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • aitryon-plus:输入不计费,输出计费。计费规则请参见图像生成

  • aitryon-parsing-v1:输入计费,输出不计费。按输入的图像张数计费,请求失败不计费。

模型服务

模型名称

单价

免费额度(注)

AI试衣-Plus版

aitryon-plus

$0.071677/张

无免费额度

AI试衣-图片分割

aitryon-parsing-v1

$0.000574/张

视频生成

计费规则:输入不计费,输出计费。输出按成功生成的 视频秒数 计费。

计费公式:费用 = 视频单价 × 输出的视频时长(单位:秒)

计费说明:

  • 部分模型按输出视频分辨率定价。不同分辨率(480P/720P/1080P)的计费价格有差异。

  • 部分模型按输出视频模式定价。不同视频模式(标准版/专业版)的计费价格有差异。

  • 部分模型按输出视频画幅定价。不同视频画幅(1:1/3:4)的计费价格有差异。

  • 部分模型采用统一定价,与分辨率、模式或画幅无关。

  • 请求失败不产生任何费用,也不会消耗免费额度。

通义万相-文生视频

仅输出计费,计费规则请参见视频生成

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

输出视频分辨率

输出单价

wan2.6-t2v

720P

$0.1/秒

1080P

$0.15/秒

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输出视频分辨率

输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.6-t2v

720P

$0.10/秒

50秒

1080P

$0.15/秒

wan2.5-t2v-preview

480P

$0.05/秒

50秒

720P

$0.10/秒

1080P

$0.15/秒

wan2.2-t2v-plus

480P

$0.02/秒

50秒

1080P

$0.10/秒

wan2.1-t2v-turbo

480P

$0.036/秒

200秒

720P

$0.036/秒

wan2.1-t2v-plus

720P

$0.10/秒

200秒

美国

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称

输出视频分辨率

输出单价

wan2.6-t2v-us

720P

$0.1/秒

1080P

$0.15/秒

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输出视频分辨率

输出单价

wan2.6-t2v

720P

$0.086012/秒

1080P

$0.143353/秒

wan2.5-t2v-preview

480P

$0.043006/秒

720P

$0.086012/秒

1080P

$0.143353/秒

wan2.2-t2v-plus

480P

$0.02007/秒

1080P

$0.100347/秒

wanx2.1-t2v-turbo

480P

$0.034405/秒

720P

$0.034405/秒

wanx2.1-t2v-plus

720P

$0.100347/秒

通义万相-图生视频-基于首帧

仅输出计费,计费规则请参见视频生成

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

输出视频类型

输出视频分辨率

输出单价

wan2.6-i2v

有声视频

720P

$0.1/秒

1080P

$0.15/秒

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输出视频类型

输出视频分辨率

输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.6-i2v-flash

有声视频

audio=true

720P

$0.05/秒

50秒

1080P

$0.075/秒

无声视频

audio=false

720P

$0.025/秒

1080P

$0.0375/秒

wan2.6-i2v

有声视频

720P

$0.10/秒

50秒

1080P

$0.15/秒

wan2.5-i2v-preview

有声视频

480P

$0.05/秒

50秒

720P

$0.10/秒

1080P

$0.15/秒

wan2.2-i2v-flash

无声视频

480P

$0.015/秒

50秒

720P

$0.036/秒

wan2.2-i2v-plus

无声视频

480P

$0.02/秒

50秒

1080P

$0.10/秒

wan2.1-t2v-turbo

无声视频

480P

$0.036/秒

200秒

720P

$0.036/秒

wan2.1-t2v-plus

无声视频

720P

$0.10/秒

200秒

美国

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称

输出视频类型

输出视频分辨率

输出单价

wan2.6-i2v-us

有声视频

720P

$0.1/秒

1080P

$0.15/秒

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输出视频类型

输出视频分辨率

输出单价

wan2.6-i2v-flash

有声视频

audio=true

720P

$0.043006/秒

1080P

$0.071676/秒

无声视频

audio=false

720P

$0.021503/秒

1080P

$0.035838/秒

wan2.6-i2v

有声视频

720P

$0.086012/秒

1080P

$0.143353/秒

wan2.5-i2v-preview

有声视频

480P

$0.043006/秒

720P

$0.086012/秒

1080P

$0.143353/秒

wan2.2-i2v-plus

无声视频

480P

$0.02007/秒

1080P

$0.100347/秒

wanx2.1-t2v-turbo

无声视频

480P

$0.034405/秒

720P

$0.034405/秒

wanx2.1-t2v-plus

无声视频

720P

$0.100347/秒

通义万相-图生视频-基于首尾帧

仅输出计费,计费规则请参见视频生成

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输出视频分辨率

输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.2-kf2v-flash

480P

$0.015/秒

50秒

720P

$0.036/秒

1080P

$0.07/秒

wan2.1-kf2v-plus

720P

$0.10/秒

200秒

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输出视频分辨率

输出单价

wan2.2-kf2v-flash

480P

$0.014335/秒

720P

$0.028671/秒

1080P

$0.068809/秒

wanx2.1-kf2v-plus

720P

$0.100347/秒

通义万相-参考生视频

计费规则:输入视频和输出视频均计费,按视频秒数计费,失败不计费也不占用免费额度。

  • 计费公式:计费时长 = 输入视频时长(上限 5 秒)+ 输出视频时长。

    • 输入视频的计费时长不超过 5 秒,计算规则参见计费与限流

    • 输出视频的计费时长为成功生成的视频秒数

  • 定价说明:计费单价由分辨率档位和 audio(是否输出有声视频)决定,与输入视频的实际分辨率或音频状态无关。

全球

全球部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称

输出视频类型

输出视频分辨率

输入和输出单价

wan2.6-r2v

有声视频

720P

$0.1/秒

1080P

$0.15/秒

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输出视频类型

输出视频分辨率

输入和输出单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.6-r2v-flash

有声视频

audio=true

720P

$0.05/秒

50秒

1080P

$0.075/秒

无声视频

audio=false

720P

$0.025/秒

1080P

$0.0375/秒

wan2.6-r2v

有声视频

720P

$0.10/秒

50秒

1080P

$0.15/秒

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输出视频类型

输出视频分辨率

输入和输出单价

wan2.6-r2v-flash

有声视频

audio=true

720P

$0.043006/秒

1080P

$0.071676/秒

无声视频

audio=false

720P

$0.021503/秒

1080P

$0.035838/秒

wan2.6-r2v

有声视频

720P

$0.086012/秒

1080P

$0.143353/秒

通义万相-通用视频编辑

仅输出计费,计费规则请参见视频生成

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输出视频分辨率

输出单价

免费额度(注)

wan2.1-vace-plus

720P

$0.10/秒

50秒

有效期:阿里云百炼开通后90天内

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输出视频分辨率

输出单价

wanx2.1-vace-plus

720P

$0.100347/秒

通义万相-数字人

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • wan2.2-s2v-detect:输入计费,输出不计费。输入按检测的图像张数计费,只要请求成功(无论检测结果通过与否),每张输入图像均计费一次。

  • wan2.2-s2v:输入不计费,输出计费。输出按成功生成的视频秒数计费,计费规则请参见视频生成

模型服务

模型名称

单价

免费额度(注)

图像检测

wan2.2-s2v-detect

输入图像:$0.000574/张

无免费额度

视频生成

wan2.2-s2v

输出视频:

  • 480P:$0.071677/秒

  • 720P:$0.129018/秒

通义万相-图生动作

仅输出计费,计费规则请参见视频生成

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输出视频模式

输出单价

免费额度(注)

wan2.2-animate-move

标准模式wan-std

$0.12/秒

50秒

有效期:阿里云百炼开通后90天内

专业模式wan-pro

$0.18/秒

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输出视频模式

输出单价

wan2.2-animate-move

标准模式wan-std

$0.06/秒

专业模式wan-pro

$0.09/秒

通义万相-视频换人

仅输出计费,计费规则请参见视频生成

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输出视频模式

输出单价

免费额度(注)

wan2.2-animate-mix

标准模式wan-std

$0.18/秒

50秒

有效期:阿里云百炼开通后90天内

专业模式wan-pro

$0.26/秒

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输出视频模式

输出单价

wan2.2-animate-mix

标准模式wan-std

$0.09/秒

专业模式wan-pro

$0.13/秒

舞动人像AnimateAnyone

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • animate-anyone-detect-gen2:输入计费,输出不计费。输入按检测的图像张数计费,只要请求成功(无论检测结果通过与否),每张输入图像均计费一次。

  • animate-anyone-template-gen2:输入不计费,输出计费。输出按成功生成的视频秒数计费,计费规则请参见视频生成

  • animate-anyone-gen2:输入不计费,输出计费。输出按成功生成的视频秒数计费,计费规则请参见视频生成

模型服务

模型名称

单价

免费额度(注)

图像检测

animate-anyone-detect-gen2

输入图像:$0.000574/张

无免费额度

动作模板生成

animate-anyone-template-gen2

输出视频:$0.011469/秒

视频生成

animate-anyone-gen2

输出视频:$0.011469/秒

悦动人像EMO

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • emo-detect-v1:输入计费,输出不计费。输入按检测的图像张数计费,只要请求成功(无论检测结果通过与否),每张输入图像均计费一次。

  • emo-v1:输入不计费,输出计费。输出按成功生成的视频秒数计费,计费规则请参见视频生成

模型服务

模型名称

单价

免费额度(注)

图像检测

emo-detect-v1

输入图像:$0.000574/张

无免费额度

视频生成

emo-v1

输出视频:

  • 1:1画幅视频:$0.011469/秒

  • 3:4画幅视频:$0.022937/秒

灵动人像LivePortrait

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • liveportrait-detect:输入计费,输出不计费。输入按检测的图像张数计费,只要请求成功(无论检测结果通过与否),每张输入图像均计费一次。

  • liveportrait:输入不计费,输出计费。输出按成功生成的视频秒数计费,计费规则请参见视频生成

模型服务

模型名称

单价

免费额度(注)

图像检测

liveportrait-detect

输入图像:$0.000574/张

无免费额度

视频生成

liveportrait

输出视频:$0.002868/秒

表情包Emoji

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

  • emoji-detect-v1:输入计费,输出不计费。输入按检测的图像张数计费,只要请求成功(无论检测结果通过与否),每张输入图像均计费一次。

  • emoji-v1:输入不计费,输出计费。输出按成功生成的视频秒数计费,计费规则请参见视频生成

模型服务

模型名称

单价

免费额度(注)

图像检测

emoji-detect-v1

输入图像:$0.000574/张

无免费额度

视频生成

emoji-v1

输出视频:$0.011469/秒

声动人像VideoRetalk

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见视频生成

模型名称

输出单价

免费额度(注)

videoretalk

$0.011469/秒

无免费额度

视频风格重绘

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

仅输出计费,计费规则请参见视频生成

模型名称

输出视频分辨率

输出单价

免费额度(注)

video-style-transform

540P

$0.028671/秒

无免费额度

720P

$0.071677/秒

语音合成(文本转语音)

Qwen-TTS

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

qwen3-tts系列模型

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价

免费额度(注)

qwen3-tts-flash

$0.1/万字符

2025年11月13日0点前开通阿里云百炼:2000字符

2025年11月13日0点后开通阿里云百炼:1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-flash-2025-11-27

$0.1/万字符

1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-flash-2025-09-18

$0.1/万字符

2025年11月13日0点前开通阿里云百炼:2000字符

2025年11月13日0点后开通阿里云百炼:1万字符

有效期:阿里云百炼开通后90天内

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

qwen3-tts系列模型

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

输出单价(每万字符)

qwen3-tts-flash

$0.114682

不计费

qwen3-tts-flash-2025-11-27

$0.114682

不计费

qwen3-tts-flash-2025-09-18

$0.114682

不计费

qwen-tts系列模型

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

qwen-tts-flash

$0.23

$1.434

qwen-tts-latest

$0.23

$1.434

qwen-tts-2025-05-22

$0.23

$1.434

qwen-tts-2025-04-10

$0.23

$1.434

Qwen-TTS-Realtime

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

通义千问3-TTS-Instruct-Flash-Realtime

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

免费额度(注)

qwen3-tts-instruct-flash-realtime

$0.143

1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-instruct-flash-realtime-2026-01-22

$0.143

1万字符

有效期:阿里云百炼开通后90天内

通义千问3-TTS-VD-Realtime

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

免费额度(注)

qwen3-tts-vd-realtime-2026-01-15

$0.143353

1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-vd-realtime-2025-12-16

$0.143353

1万字符

有效期:阿里云百炼开通后90天内

通义千问3-TTS-VC-Realtime

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

免费额度(注)

qwen3-tts-vc-realtime-2026-01-15

$0.13

1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-vc-realtime-2025-11-27

通义千问3-TTS-Flash-Realtime

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

免费额度(注)

qwen3-tts-flash-realtime

$0.13

2025年11月13日0点前开通阿里云百炼:2000字符

2025年11月13日0点后开通阿里云百炼:1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-flash-realtime-2025-11-27

$0.13

1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-flash-realtime-2025-09-18

$0.13

2025年11月13日0点前开通阿里云百炼:2000字符

2025年11月13日0点后开通阿里云百炼:1万字符

有效期:阿里云百炼开通后90天内

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

通义千问3-TTS-Instruct-Flash-Realtime

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

输出单价

qwen3-tts-instruct-flash-realtime

$0.143

不计费

qwen3-tts-instruct-flash-realtime-2026-01-22

$0.143

不计费

通义千问3-TTS-VD-Realtime

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

输出单价

qwen3-tts-vd-realtime-2026-01-15

$0.143353

不计费

qwen3-tts-vd-realtime-2025-12-16

$0.143353

不计费

通义千问3-TTS-VC-Realtime

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

输出单价

qwen3-tts-vc-realtime-2026-01-15

$0.143353

不计费

qwen3-tts-vc-realtime-2025-11-27

通义千问3-TTS-Flash-Realtime

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价(每万字符)

输出单价

qwen3-tts-flash-realtime

$0.143353

不计费

qwen3-tts-flash-realtime-2025-11-27

$0.143353

不计费

qwen3-tts-flash-realtime-2025-09-18

$0.143353

不计费

通义千问-TTS-Realtime

计费规则:按输入Token和输出Token计费。

模型名称

输入单价(每百万Token)

输入单价(每百万Token)

qwen-tts-realtime

$0.345

$1.721

qwen-tts-realtime-latest

$0.345

$1.721

qwen-tts-realtime-2025-07-15

$0.345

$1.721

Qwen-TTS声音复刻

计费规则:按新建音色个数计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

单价(每个音色)

免费额度(注)

qwen-voice-enrollment

$0.01

1000个音色/账号

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

单价(每个音色)

qwen-voice-enrollment

$0.01

Qwen-TTS声音设计

计费规则:按新建音色个数计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

单价(每个音色)

免费额度(注)

qwen-voice-design

$0.2

10个音色/账号

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

单价(每个音色)

qwen-voice-design

$0.2

CosyVoice

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入文本的字符数计费,输出不计费。

模型名称

输入单价

免费额度(注)

cosyvoice-v3-plus

$0.286706/万字符

无免费额度

cosyvoice-v3-flash

$0.14335/万字符

cosyvoice-v2

$0.286706/万字符

语音识别(语音转文本)与翻译(语音转成指定语种的文本)

通义千问3-LiveTranslate-Flash-Realtime

计费规则:按输入Token和输出Token计费。不同模态的Token计算规则请参见计费说明

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

输入:音频

输入:图片

输出:文本

输出:音频

qwen3-livetranslate-flash-realtime

$10

$1.3

$10

$38

各 100 万Token
有效期:阿里云百炼开通后90天内

qwen3-livetranslate-flash-realtime-2025-09-22

$10

$1.3

$10

$38

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

输入:音频

输入:图片

输出:文本

输出:音频

qwen3-livetranslate-flash-realtime

$9.175

$1.147

$9.175

$34.405

qwen3-livetranslate-flash-realtime-2025-09-22

$9.175

$1.147

$9.175

$34.405

通义千问ASR

计费规则:按输入音频的秒数计费,输出不计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价

免费额度(注)

qwen3-asr-flash-filetrans

$0.000035/秒

36,000秒(10小时)
有效期:阿里云百炼开通后90天内

qwen3-asr-flash-filetrans-2025-11-17

qwen3-asr-flash

qwen3-asr-flash-2025-09-08

美国

美国部署模式下,接入点与数据存储均位于美国(弗吉尼亚)地域,模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称

输入单价

qwen3-asr-flash-us

$0.000035/秒

qwen3-asr-flash-2025-09-08-us

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输入单价

qwen3-asr-flash-filetrans

$0.000032/秒

qwen3-asr-flash-filetrans-2025-11-17

qwen3-asr-flash

qwen3-asr-flash-2025-09-08

通义千问ASR-Realtime

计费规则:按输入音频的秒数计费,输出不计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价

免费额度(注)

qwen3-asr-flash-realtime

$0.000090/秒

36,000秒(10小时)
有效期:阿里云百炼开通后90天内

qwen3-asr-flash-realtime-2025-10-27

$0.000090/秒

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输入单价

qwen3-asr-flash-realtime

$0.000047/秒

qwen3-asr-flash-realtime-2025-10-27

Fun-ASR

录音文件识别

计费规则:按输入音频的秒数计费,输出不计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价

免费额度(注)

fun-asr

$0.000035/秒

36,000秒(10小时)
有效期 90 天

fun-asr-2025-11-07

fun-asr-2025-08-25

fun-asr-mtl

fun-asr-mtl-2025-08-25

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输入单价

fun-asr

$0.000032/秒

fun-asr-2025-11-07

fun-asr-2025-08-25

fun-asr-mtl

fun-asr-mtl-2025-08-25

实时语音识别

计费规则:按输入音频的秒数计费,输出不计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价

免费额度(注)

fun-asr-realtime

$0.00009/秒

36,000秒(10小时)

有效期90天

fun-asr-realtime-2025-11-07

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输入单价

fun-asr-realtime

$0.000047/秒

fun-asr-realtime-2025-11-07

fun-asr-realtime-2025-09-15

Paraformer

录音文件识别

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入音频的秒数计费,输出不计费。

模型名称

输入单价

paraformer-v2

$0.000012/秒

paraformer-8k-v2

实时语音识别

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

计费规则:按输入音频的秒数计费,输出不计费。

模型名称

输入单价

免费额度(注)

paraformer-realtime-v2

$0.000035/秒

无免费额度

paraformer-realtime-8k-v2

文本向量

计费规则:按输入Token计费,输出不计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价 (每百万Token)

免费额度(注)

text-embedding-v4

$0.07

100万Token
有效期:阿里云百炼开通后90天内

text-embedding-v3

$0.07

50万Token
有效期:阿里云百炼开通后90天内

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

text-embedding-v4

$0.072

多模态向量

计费规则:按输入Token计费,输出不计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价(每百万输入Token)

免费额度(注)

tongyi-embedding-vision-plus

$0.09

100万Token

有效期:百炼开通后90天内

tongyi-embedding-vision-flash

图片/视频:$0.03

文本:$0.09

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

免费额度(注)

qwen3-vl-embedding

图片/视频:$0.258

文本:$0.1

100万Token

有效期:百炼开通后90天内

multimodal-embedding-v1

免费试用

无Token额度限制

文本排序

计费规则:按输入Token计费,输出不计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价(每百万Token)

免费额度(注)

qwen3-rerank

$0.1

100万Token

有效期:百炼开通后90天内

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输入单价(每百万Token)

gte-rerank-v2

$0.115

行业模型

意图理解

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

tongyi-intent-detect-v3

$0.058

$0.144

无免费额度

角色扮演

计费规则:按输入Token和输出Token计费。

国际

国际部署模式下,接入点与数据存储均位于新加坡地域,模型推理计算资源在全球范围内动态调度(不含中国内地)。

模型名称

输入单价 (每百万Token)

输出单价 (每百万Token)

免费额度(注)

qwen-plus-character-ja

$0.5

$1.4

无免费额度

中国内地

中国内地部署模式下,接入点与数据存储均位于北京地域,模型推理计算资源仅限于中国内地。

模型名称

输入单价(每百万Token)

输出单价(每百万Token)

免费额度(注)

qwen-plus-character

$0.115

$0.287

无免费额度