You need to enable JavaScript to run this app.
导航
模型服务计费
最近更新时间:2025.02.19 10:23:27首次发布时间:2023.06.27 23:50:07

不同模型支持的能力及单价各不相同,存在多种计费方式和多种计费逻辑。不同业务类型,适合的服务以及计费方式不同,本文会从计费项目、计费方式、计费逻辑等维度帮助您了解模型服务产生的费用,帮助您规划费用支出。

Token 概念

模型服务用量的一个重要概念是 token。在调用模型推理服务时,会将输入内容进行分词(tokenize),转化为模型可以理解的 token ,经过模型处理后,同样输出 token,并转化为您需要的文本或者其他内容载体。而模型处理(包括输入、输出)的 token 数量会被作为模型推理服务用量的一个重要计量单位。
如语言大模型推理服务费用的一种较为常见的计算方式如下:

费用 = token 使用数量 * token 单价
  • 由于不同模型采用的分词策略不同,同一段文本可能会被转化为不同数量的 token。
  • 您可以使用Token计算器或者分词 API接口,来估算内容对应的 token 数量。

产品价格

说明

下列价格仅供参考,请以定价详情页以及实际购买页价格为准。

在线推理

大语言模型

按 token 使用量付费(后付费)

  • 出账时间:每小时出账。
  • 付款类型:按量后付费。
  • 模型范围:
    • 适用于:调用 Doubao 等语言类大模型,基于 Doubao 等大模型精调后的模型。
    • 不适用于:全量精调模型。
  • 推理服务(输出):包含模型输出的内容,包括模型返回信息里输出(content字段)以及深度模型的思维链(reasoning_content字段)内容。
  • 模型单价(刊例价):如下表,实际购买价格以下单页面为准。

模型名称

服务类型

定价
(元/千 token)

计费方式

免费额度
(token)

Doubao-1.5-pro-32k

推理服务(输入)

0.0008

后付费

50万

推理服务(输出)

0.0020

后付费

Doubao-1.5-pro-256k

推理服务(输入)

0.0050

后付费

50万

推理服务(输出)

0.0090

后付费

Doubao-1.5-lite-32k

推理服务(输入)

0.0003

后付费

50万

推理服务(输出)

0.0006

后付费

Doubao-lite-4k

包括分支版本 character

推理服务(输入)

0.0003

后付费

50万

推理服务(输出)

0.0006

后付费

Doubao-lite-32k

推理服务(输入)

0.0003

后付费

50万

推理服务(输出)

0.0006

后付费

Doubao-lite-128k

推理服务(输入)

0.0008

后付费

50万

推理服务(输出)

0.0010

后付费

Doubao-pro-4k

包括分支版本:characterfunctioncall

推理服务(输入)

0.0008

后付费

50万

推理服务(输出)

0.0020

后付费

Doubao-pro-32k

推理服务(输入)

0.0008

后付费

50万

推理服务(输出)

0.0020

后付费

Doubao-pro-128k

推理服务(输入)

0.0050

后付费

50万

推理服务(输出)

0.0090

后付费

Doubao-pro-256k

推理服务(输入)

0.0050

后付费

50万

推理服务(输出)

0.0090

后付费

Deepseek-r1

推理服务(输入)

0.0040
0.0020

后付费

50万

推理服务(输出)

0.0160
0.0080

后付费

Deepseek-r1-distill-qwen-32b

推理服务(输入)

0.0015

后付费

50万

推理服务(输出)

0.0060

后付费

Deepseek-r1-distill-qwen-7b

推理服务(输入)

0.0006

后付费

50万

推理服务(输出)

0.0024

后付费

Deepseek-v3

推理服务(输入)

0.0020

后付费

50万

推理服务(输出)

0.0080

后付费

GLM3-130B

推理服务

0.0010

后付费

50万

GLM3-130B 金融模型

推理服务

0.0010

后付费

50万

Moonshot-v1-8K

推理服务

0.0120

后付费

50万

Moonshot-v1-32K

推理服务

0.0240

后付费

50万

Moonshot-v1-128K

推理服务

0.0600

后付费

50万

Mistral-7B

推理服务

免费限量测试

-

说明

即日起至北京时间 2025-02-23 23:59:59,所有用户均可在方舟享受 DeepSeek 模型服务的价格优惠。在此之后,模型价格将恢复至原价。涉及的模型包括:

  • Deepseek-r1

按模型单元付费

  • 算力资源:独占的算力资源。
  • 售卖方式:两种模式可叠加购买,您可依据业务流量灵活采购。
    • 按月售卖
    • 按小时售

说明

  • 模型单元当前支持白名单内购买。
  • 原有模型单元依然可以续费或退费。
  • 更多说明,请参见模型单元

模型名称

计费项

性能预估
(TPS)

定价
(元/个)

计费方式

Doubao-lite-4k

模型单元(按小时)

3000

60

后付费

模型单元(包月)

3000

28000

预付费

Doubao-lite-32k

模型单元(按小时)

3000

60

后付费

模型单元(包月)

3000

28000

预付费

Doubao-lite-128k

模型单元(按小时)

4500

240

后付费

模型单元(包月)

4500

112000

预付费

Doubao-pro-4k

模型单元(按小时)

3200

160

后付费

模型单元(包月)

3200

80000

预付费

Doubao-pro-32k

模型单元(按小时)

3200

160

后付费

模型单元(包月)

3200

80000

预付费

Doubao-pro-128k

模型单元(按小时)

3500

1200

后付费

模型单元(包月)

3500

550000

预付费

视觉理解大模型

方舟会将输入的信息(包括图片)转化为 token 后,进行计量计费。具体用量统计逻辑请参见token 用量说明

模型名称

服务类型

定价
元/千 token

计费方式

免费额度
token

Doubao-1.5-vision-pro-32k

推理服务(输入)

0.0030

后付费

50万

推理服务(输出)

0.0090

后付费

Doubao-vision-lite-32k

推理服务(输入)

0.0015

后付费

50万

推理服务(输出)

0.0045

后付费

Doubao-vision-pro-32k

推理服务(输入)

0.0030

后付费

50万

推理服务(输出)

0.0090

后付费

视频生成模型

  • 计费逻辑
    • 视频生成模型按输出 token 计费,图生视频、文生视频同价。生成不同时长、不同画面尺寸的视频,将消耗不同数量的 token。
    • 用量计算近似方式如下,准确的 token 用量以调用API后返回信息中的 usage 字段为准。
  • 计费定价

    模型名称

    服务类型

    定价
    元/千 token

    计费方式

    免费额度

    Doubao-视频生成-Seaweed

    推理服务(输出)

    0.03

    后付费

    200万

  • 计费示例

    画面比例


    (像素)


    (像素)

    帧率
    (帧/秒)

    视频时长
    (秒)

    用量
    (token)

    刊例价单价
    (元)

    1:1

    720

    720

    24

    5

    60,750

    1.82

    4:3

    960

    720

    24

    5

    81,000

    2.43

    16:9

    1280

    720

    24

    5

    108,000

    3.24

    1:1

    720

    720

    24

    10

    121,500

    3.65

    4:3

    960

    720

    24

    10

    162,000

    4.86

    16:9

    1280

    720

    24

    10

    216,000

    6.48

文生图大模型

说明

Stable-DiffusionStable-Diffusion-XL 模型卡片暂未完全公开,如需申请使用,请联系与您对接的火山引擎销售人员。

模型

计费项

支持并发

定价

计费方式

豆包-文生图模型-智能绘图

推理服务

详见控制台

0.2 元/次

后付费 (免费额度 200 次)

Stable-Diffusion-1.5

模型单元(包天)

详见控制台

175 元/个

预付费

模型单元(包月)

详见控制台

4200 元/个

预付费

Stable-Diffusion-XL

模型单元(包天)

详见控制台

175 元/个

预付费

模型单元(包月)

详见控制台

4200 元/个

预付费

语音大模型

模型

服务类型

定价
元/万字

计费方式

免费额度

Doubao-语音合成

推理服务

5

后付费

5000

Doubao-声音复刻

推理服务

8

后付费

5000

文本向量模型

模型

服务类型

定价
元/千 token

计费方式

免费额度

Doubao-embedding

推理服务(输入)

0.0005

后付费

50万

Doubao-embedding-large

推理服务(输入)

0.0007

后付费

50万

图文向量模型

方舟会将输入的信息(包括图片)转化为 token 后,进行计量计费。

说明

图片tokens = (width px * height px)/784,超大图封顶1312 token。

模型

服务类型

定价
元/千 token

计费方式

免费额度

Doubao-embedding-vision

推理服务(输入)

  • 文本输入:0.0007 元/千 tokens
  • 图片输入:0.0018 元/千 tokens

后付费

50万

上下文缓存计费

计费项

与普通的在线推理有所不同,使用了Session 缓存后,计费项会变更为下面几个计费项:

  • 输入内容(元/千token):使用会话缓存的有状态 API,您无需重新发送之前的对话轮次。输入token 仅代表添加到正在进行的对话中的新文本。
  • 命中缓存内容(元/千token):Context API 会自动处理之前的对话历史记录,因此在请求期间访问的所有相关的先前对话 token 都将计为缓存命中。缓存命中的计费费率会低于输入,使多轮对话更具成本效益。
  • 存储(元/千token/小时):存储按小时计费,基于每个自然小时内存储的最大token数。即使Context会一直保留,直到被删除,详细工作原理见触发过期时间。极端情况下Context 创建后没被使用,收费会持续到上下文的生存时间 (TTL) 过期。
  • 输出内容(元/千token):输出代表模型生成的内容。计费方式与标准语言模型的使用保持一致。

计费逻辑

说明

  • 免费额度可以抵扣使用上下文缓存命中缓存的token、未命中缓存的token、输出产生的token,但是无法抵扣缓存上下文产生的存储费用。

计费单价

模型名称

输入价格
元/千token

缓存存储
元/千token/小时

缓存命中
元/千token

输出价格
元/千token

Doubao-1.5-pro-32k

0.000800

0.000017

0.000160

0.002000

Doubao-1.5-lite-32k

0.000300

0.000017

0.000060

0.000600

Doubao-pro-32k

0.000800

0.000017

0.000160

0.002000

Deepseek-r1-distill-qwen-32b

0.001500

0.000017

0.000300

0.006000

TPM 保障包

计费逻辑

选择了 预付费(按天)付款方式的 TPM 保障包,请注意以下信息:

  • 生效时间:实时生效
  • 到期时间:N+1 天的12:00。N为您购买的 TPM 保障包的天数。

举例:早上9:00下单,第二天中午12点到期;晚上 21:00 下单,第二天中午12点到期。

  • 提前退订:会按照这个逻辑计算时间并扣费,满足一天的天数 + 未满一天的时间(超过12:00 a.m.的时间)*1.5

举例:您提前了22小时退订,即下午14点退订,未满一天的时间为2小时。则扣费会计算为(2小时*1.5+使用天数)*单价

  • 建议开启自动续费能力,您可以在官网费用中心查看当前自动续费起始时间。

单价

模型

计费项

输入or输出

单价(元)

Doubao-pro-32k

TPM保障包(小时后付费)- 输入-每10K TPM

输入

1.920

TPM保障包(小时后付费)- 输出-每1K TPM

输出

0.480

TPM保障包(包天预付费)- 输入-每10K TPM

输入

23.040

TPM保障包(包天预付费)- 输出-每1K TPM

输出

5.760

批量推理

大语言模型

批量推理计费单价与按 token 使用量付费(后付费)一致。您仅需为已处理的请求消耗的 token 量付费,具体用量可在批量推理任务详情页「Tokens 使用量」查看。

注意

注意批量推理暂不支持使用免费试用额度抵扣。

模型精调

大语言模型

按 token 使用量(训练文本*训练迭代次数)计费,训练完成后出账,按量后付费。

模型

服务类型

定价
元/千 token

计费方式

Doubao-lite-4k

模型精调(LoRA)

0.03

后付费

Doubao-lite-32k

模型精调(LoRA)

0.03

后付费

Doubao-lite-128k

模型精调(LoRA)

0.03

后付费

Doubao-pro-4k

模型精调(LoRA)

0.05

后付费

Doubao-pro-32k

模型精调(LoRA)

0.05

后付费

使用限制

模型推理限制

当前对每个模型设置了 RPM(Requests Per Minute,每分钟请求数)及 TPM(Tokens Per Minute,每分钟 token 数量)的调用限制,每个账号(含主账号下的所有子账号,合并计算)的具体限制可在开通管理页中查看。
如需提升,请联系客户经理或者提交工单

模型精调限制

每个账号会有最多可同时创建运行中的精调任务数的限制,具体限制请见控制台报错提示,若到达上限的,请耐心等待精调任务完成并释放额度后重试,或在配额中心中提交申请更多额度。

服务关停
  • 账户余额不足或账户余额小于 0 被扣为负值即为欠费。
  • 账号欠费后 2 小时内补缴所有欠费账单的,可正常使用火山方舟模型服务。若欠费后 2 小时仍未能补缴所有欠费账单,则账号下的所有火山方舟相关模型服务将无法正常使用,请及时补缴所有欠费账单以避免服务中断带来的影响。

模型单元购买说明

使用模型单元创建完成的模型推理接入点,支持对模型单元进行增减购买、到期续费配置调整。7 天内到期的模型单元会出现到期提醒。

  • 补款退款:会根据实际使用的模型单元数量、时长进行计费。因为是预付费,因此如果进行扩缩容的操作,也会对应有补款和退款。
  • 到期时间说明
    • 按天购买模型单元,购买资源的到期时间按照自然日计算,从购买日算起,到期时间为到期自然日+1 天的中午 12 点。如您在 5 月 13 日上午 9 点购买一天的模型单元,相当于您购买了到期时间为 5 月 13 日 24 点的资源,实际到期时间为 5 月 14 日中午 12 点整。
    • 资源到期后将被回收,您可以在资源被回收前在方舟产品控制台或订单管理页面进行续费,回收时间为到期时间+ 48 小时。即如您在 5 月 13 日上午 9 点购买一天的模型单元,相当于您购买了到期时间为 5 月 13 日 24 点的资源,在 5 月 15 日 24 点之前都可以进行续费。在回收期结束后,模型单元无法续费,您需要重新创建一个模型推理接入点来满足继续使用的需求。
    • 强烈推荐您为资源配置自动续费,以避免由于未配置自动续费导致的业务中断。
  • 模型单元调整、续费、退订。
    通过【模型推理】列表页,找到需要调整的接入点,点击右侧的 ··· 可以进行调整模型单元、续费、退订。
    点击续费按钮,会跳转到费用中心的续费管理页面,可以进行续费操作。
  • 模型单元退订。
    想要退订模型单元,进入推理接入点详情页,点击退订
    注意:因为模型单元是按实例组购买的,点击接入点名称详情中复制的模型单元 ID 是实例组 ID,实例组存在强绑定关系,因此续费、退订须同步发起。请注意,未到期的模型单元退订会产生惩罚系数,无法 100%退费。

常见问题

模型推理请求报错或者中断会计费么?