You need to enable JavaScript to run this app.
导航
模型服务价格
最近更新时间:2025.04.28 18:03:37首次发布时间:2025.04.28 12:03:54
我的收藏
有用
有用
无用
无用

不同模型服务支持的能力及单价各不相同,本文为您介绍各模型的计费公式及单价,方便您进行模型价格查阅和比较。

说明

如需了解模型服务各功能模块支持的计费方式及详细计费逻辑,请参见 模型服务计费说明
支持通过 价格计算器 预估 满足业务需求所需的费用。
本文价格和 定价详情页 仅作为商品规格和价格的参考,具体可购买的商品规格及费用请以实际下单结果为准。

深度思考模型

在线推理

按 token 后付费价格

计费公式
在线推理费用 = 输入单价 × 输入token + 输出单价 × 输出token,其中输出 token 包括模型输出content内容和思维链
reasoning_content内容。

若开启 上下文缓存(部分模型支持),
在线推理费用 = 输入单价 × (输入token - 缓存命中token) + 缓存命中单价 × 缓存命中token + 缓存存储单价 × 缓存存储token × 时长 + 输出单价 × 输出token

计费单价

模型名称

输入
元/百万token

缓存存储
元/百万token/小时

缓存命中
元/百万token

输出
元/百万token

doubao-1.5-thinking-pro

m-250415版本

4.00

不支持

不支持

16.00

deepseek-r1

4.00

0.017

0.80

16.00

deepseek-r1-distill-qwen-32b

1.50

0.017

0.30

6.00

deepseek-r1-distill-qwen-7b

0.60

不支持

不支持

2.40

批量推理

按 token 后付费价格
5折表示该模型的批量推理价格是在线推理价格的50%;未标注则表示与在线推理同价。

计费公式
批量推理费用 = 输入单价 × 输入token + 输出单价 × 输出token, 其中输出token包括模型输出content内容和思维链
reasoning_content内容。

若开启缓存功能(部分模型于2025年4月14日21:00开始支持透明前缀缓存能力,无需任何配置,命中缓存后可享受更低的单价),
批量推理费用 = 输入单价 × (输入token 不支持 缓存命中token) + 缓存命中单价 × 缓存命中token + 输出单价 × 输出token

计费单价

模型名称

输入
元/百万token

缓存命中
元/百万token

输出
元/百万token

doubao-1.5-thinking-pro5折

m-250425版本

2.00

不支持

8.00

deepseek-r1 5折

2.00

0.80

8.00

deepseek-r1-distill-qwen-32b 5折

0.75

不支持

3.00

deepseek-r1-distill-qwen-7b 5折

0.30

不支持

1.20

大语言模型

在线推理

按 token 后付费价格

计费公式
在线推理费用 = 输入单价 × 输入token + 输出单价 × 输出token

若开启 上下文缓存(部分模型支持),
在线推理费用 = 输入单价 × (输入token - 缓存命中token) + 缓存命中单价 × 缓存命中token + 缓存存储单价 × 缓存存储token × 时长 + 输出单价 × 输出token

计费单价

模型名称

输入
元/百万token

缓存存储
元/百万token/小时

缓存命中
元/百万token

输出
元/百万token

doubao-1.5-pro-32k

0.80

0.017

0.16

2.00

doubao-1.5-pro-256k

5.00

不支持

不支持

9.00

doubao-1.5-lite-32k

0.30

0.017

0.06

0.60

doubao-pro-4k
包括分支版本characterfunctioncall

0.80

不支持

不支持

2.00

doubao-pro-32k

0.80

0.017

0.16

2.00

doubao-pro-128k

5.00

不支持

不支持

9.00

doubao-pro-256k

5.00

不支持

不支持

9.00

doubao-lite-4k
包括分支版本 character

0.30

不支持

不支持

0.60

doubao-lite-32k

0.30

0.017

0.06

0.60

doubao-lite-128k

0.80

不支持

不支持

1.00

deepseek-v3

2.00

0.017

0.40

8.00

moonshot-v1-8k

12.00

不支持

不支持

12.00

moonshot-v1-32k

24.00

不支持

不支持

24.00

moonshot-v1-128k

60.00

不支持

不支持

60.00

批量推理

按 token 后付费价格
5折表示该模型的批量推理价格是在线推理价格的50%;未标注则表示与在线推理同价。

计费公式
批量推理费用 = 输入单价 × 输入token + 输出单价 × 输出token

若开启缓存功能(部分模型于2025年4月14日21:00开始支持透明前缀缓存能力,无需任何配置,命中缓存后可享受更低的单价),
批量推理费用 = 输入单价 × (输入token - 缓存命中token) + 缓存命中单价 × 缓存命中token + 输出单价 × 输出token

计费单价

模型名称

输入
元/百万token

缓存命中
元/百万token

输出
元/百万token

Doubao-1.5-pro-32k 5折

0.40

0.16

1.00

Doubao-1.5-pro-256k

5.00

不支持

9.00

Doubao-1.5-lite-32k 5折

0.15

0.06

0.30

Doubao-pro-32k

0.80

0.16

2.00

Doubao-lite-32k

0.30

0.06

0.60

deepseek-v3 5折

1.00

0.40

4.00

视觉理解模型

将输入信息(包括图片)转化为 token 计费

计费公式
推理费用 = 输入单价 × 输入token + 输出单价 × 输出token
图片tokens = min(图片宽 × 图片高 ÷ 784, 单图 token 限制),具体用量统计逻辑请参见 token 用量说明

在线推理

按 token 后付费价格

模型

输入
元/百万token

输出
元/百万token

doubao-1.5-vision-pro

3.00

9.00

doubao-1.5-vision-lite

1.50

4.50

doubao-1.5-ui-tars

3.50

12.00

doubao-1.5-vision-pro-32k

3.00

9.00

doubao-vision-pro-32k

3.00

9.00

doubao-vision-lite-32k

1.50

4.50

批量推理

按 token 后付费价格
5折表示该模型的批量推理价格是在线推理价格的50%;未标注则表示与在线推理同价。

模型

输入
元/百万token

输出
元/百万token

doubao-1.5-vision-pro-32k 5折

1.50

4.50

视频生成模型

异步推理,将输出视频转化为 token 计费
按 token 后付费价格

计费公式
推理费用 = 视频生成单价 × 输出token
图片tokens ≈ (宽 × 高 × 帧率 × 时长)/1024,准确的 token 用量以调用API后返回信息中的usage字段为准。

单价

模型

文生视频
元/百万token

图生视频
元/百万token

doubao-seaweed

30.00

30.00

wan2.1-14b

50.00

50.00

计费示例

模型

画面比例


(像素)


(像素)

帧率
(帧/秒)

视频时长
(秒)

用量
(token)

单价
(元)

doubao-seaweed

1:1

720

720

24

5

60,750

1.82

4:3

960

720

24

5

81,000

2.43

16:9

1280

720

24

5

108,000

3.24

1:1

720

720

24

10

121,500

3.65

4:3

960

720

24

10

162,000

4.86

16:9

1280

720

24

10

216,000

6.48

1:1

480

480

24

5

27,000

0.81

4:3

640

480

24

5

36,000

1.08

16:9

848

480

24

5

47,700

1.43

1:1

480

480

24

10

54,000

1.62

4:3

640

480

24

10

72,000

2.16

16:9

848

480

24

10

95,400

2.86

wan2.1-14b

16:9

832

480

16

5

31,200

1.56

16:9

1280

720

16

5

72,000

3.6

文本向量模型

将输入信息转化为 token 计费
按 token 后付费价格

模型

输入
元/百万token

doubao-embedding

0.50

doubao-embedding-large

0.70

图文向量模型

将输入信息(包括图片)转化为 token 计费
按 token 后付费价格

计费公式
推理费用 = 文本输入单价 × 文本token + 图片输入单价 × 图片输入token
图片tokens = (width px × height px)/784,超大图封顶 1312 token。

计费单价

模型

文本输入
元/百万token

图片输入
元/百万token

doubao-embedding-vision

0.70

1.80

文生图模型

按使用次数后付费价格,单位:元/次

模型

支持并发

定价
元/百万token

豆包-文生图模型-智能绘图

详见控制台

0.2

语音模型

按输入字数后付费价格,单位:元/万字

模型

定价
元/百万token

doubao-语音合成

5

doubao-声音复刻

8

TPM 保障包

对于部分模型,支持购买 TPM(Tokens Per Minute)保障包。对成功购买的保障包内,保障 token 并发。相比单纯的按token计费,可获得更高的并发,更低的延迟,更强的稳定性。
「小时后付费」和「包月预付费」两种方式支持叠加购买,您可依据业务流量灵活采购。

深度思考模型

模型

计费方式

输入

输出

deepseek-r1

小时后付费

9.60 元/每10K TPM

3.84 元/每1K TPM

包天预付费

115.20 元/每10K TPM

46.08 元/每1K TPM

deepseek-v3

小时后付费

4.80 元/每10K TPM

1.92 元/每1K TPM

包天预付费

57.60 元/每10K TPM

23.04 元/每1K TPM

大语言模型

模型

计费方式

输入

输出

doubao-1.5-pro-32k

小时后付费

1.920 元/每10K TPM

0.480 元/每1K TPM

包天预付费

23.040 元/每10K TPM

5.760 元/每1K TPM

doubao-1.5-lite-32k

小时后付费

0.72 元/每10K TPM

0.144 元/每1K TPM

包天预付费

8.64 元/每10K TPM

1.728 元/每1K TPM

doubao-pro-32k

小时后付费

1.920 元/每10K TPM

0.480 元/每1K TPM

包天预付费

23.040 元/每10K TPM

5.760 元/每1K TPM

模型精调

精调训练

按 token 后付费价格

计费公式
训练费用 = 训练tokens量 x 精调单价 = (数据集总 tokens x 迭代轮次)x 精调单价
若 token 数小于 1000,将会上取整为 1000 tokens 计算。

计费单价

基础模型

LoRA精调
元/百万token

全量精调
元/百万token

doubao-1.5-pro-32k

50

100

doubao-1.5-lite-32k

30

60

doubao-pro-32k

50

-

doubao-lite-32k

30

-

精调后在线推理

按 token 后付费价格

说明

  • 仅部分 doubao 模型精调后在线推理支持按 token 付费,以创建在线推理接入点页面可选的付费方式为准。
  • doubao 1.5 及后续模型的精调后推理服务在延迟和性能方面较旧版模型有比较明显的提升,在大流量场景的稳定性也有提升。

精调模型对应的基础模型

输入
元/百万token

输出
元/百万token

doubao-1.5-pro-32k

2.00

5.00

doubao-1.5-lite-32k

0.75

1.50

doubao-pro-32k

0.80

2.00

doubao-lite-32k

0.30

0.60

精调后批量推理

按 token 后付费价格

精调模型对应的基础模型

输入
元/百万token

缓存命中
元/百万token

输出
元/百万token

doubao-1.5-pro-32k

0.40

0.16

1.00

doubao-1.5-lite-32k

0.15

0.06

0.30

doubao-pro-32k

0.80

0.16

2.00

doubao-lite-32k

0.30

0.06

0.60

模型单元(邀测)

对于部分模型,支持按模型单元付费。模型单元提供专属算力,对精调后模型表现更优。
「按小时后付费」和「包月预付费」两种方式支持叠加购买,您可依据业务流量灵活采购。

说明

此为邀测能力,如需使用,提交测试申请工单

大语言模型

模型

计费方式

性能预估
TPS
(Tokens Per Second)

定价
元/个

doubao-lite-4k

按小时后付费

3000

60

包月预付费

3000

28000

doubao-lite-32k

按小时后付费

3000

60

包月预付费

3000

28000

doubao-lite-128k

按小时后付费

4500

240

包月预付费

4500

112000

doubao-pro-4k

按小时后付费

3200

160

包月预付费

3200

80000

doubao-pro-32k

按小时后付费

3200

160

包月预付费

3200

80000

doubao-pro-128k

按小时后付费

3500

1200

包月预付费

3500

550000