不同模型支持的能力及单价各不相同,存在多种计费方式和多种计费逻辑。不同业务类型,适合的服务以及计费方式不同,本文会从计费项目、计费方式、计费逻辑等维度帮助您了解模型服务产生的费用,帮助您规划费用支出。
模型服务用量的一个重要概念是 token。在调用模型推理服务时,会将输入内容进行分词(tokenize),转化为模型可以理解的 token ,经过模型处理后,同样输出 token,并转化为您需要的文本或者其他内容载体。而模型处理(包括输入、输出)的 token 数量会被作为模型推理服务用量的一个重要计量单位。
如语言大模型推理服务费用的一种较为常见的计算方式如下:
费用 = token 使用数量 * token 单价
说明
下列价格仅供参考,请以定价详情页以及实际购买页价格为准。
content
字段)以及深度模型的思维链(reasoning_content
字段)内容。模型名称 | 服务类型 | 定价 | 计费方式 | 免费额度 |
---|---|---|---|---|
Doubao-1.5-pro-32k | 推理服务(输入) | 0.0008 | 后付费 | 50万 |
推理服务(输出) | 0.0020 | 后付费 | ||
Doubao-1.5-pro-256k | 推理服务(输入) | 0.0050 | 后付费 | 50万 |
推理服务(输出) | 0.0090 | 后付费 | ||
Doubao-1.5-lite-32k | 推理服务(输入) | 0.0003 | 后付费 | 50万 |
推理服务(输出) | 0.0006 | 后付费 | ||
Doubao-lite-4k
| 推理服务(输入) | 0.0003 | 后付费 | 50万 |
推理服务(输出) | 0.0006 | 后付费 | ||
Doubao-lite-32k | 推理服务(输入) | 0.0003 | 后付费 | 50万 |
推理服务(输出) | 0.0006 | 后付费 | ||
Doubao-lite-128k | 推理服务(输入) | 0.0008 | 后付费 | 50万 |
推理服务(输出) | 0.0010 | 后付费 | ||
Doubao-pro-4k
| 推理服务(输入) | 0.0008 | 后付费 | 50万 |
推理服务(输出) | 0.0020 | 后付费 | ||
Doubao-pro-32k | 推理服务(输入) | 0.0008 | 后付费 | 50万 |
推理服务(输出) | 0.0020 | 后付费 | ||
Doubao-pro-128k | 推理服务(输入) | 0.0050 | 后付费 | 50万 |
推理服务(输出) | 0.0090 | 后付费 | ||
Doubao-pro-256k | 推理服务(输入) | 0.0050 | 后付费 | 50万 |
推理服务(输出) | 0.0090 | 后付费 | ||
Deepseek-r1 | 推理服务(输入) |
| 后付费 | 50万 |
推理服务(输出) |
| 后付费 | ||
Deepseek-r1-distill-qwen-32b | 推理服务(输入) | 0.0015 | 后付费 | 50万 |
推理服务(输出) | 0.0060 | 后付费 | ||
Deepseek-r1-distill-qwen-7b | 推理服务(输入) | 0.0006 | 后付费 | 50万 |
推理服务(输出) | 0.0024 | 后付费 | ||
Deepseek-v3 | 推理服务(输入) | 0.0020 | 后付费 | 50万 |
推理服务(输出) | 0.0080 | 后付费 | ||
GLM3-130B | 推理服务 | 0.0010 | 后付费 | 50万 |
GLM3-130B 金融模型 | 推理服务 | 0.0010 | 后付费 | 50万 |
Moonshot-v1-8K | 推理服务 | 0.0120 | 后付费 | 50万 |
Moonshot-v1-32K | 推理服务 | 0.0240 | 后付费 | 50万 |
Moonshot-v1-128K | 推理服务 | 0.0600 | 后付费 | 50万 |
Mistral-7B | 推理服务 | 免费限量测试 | - |
说明
即日起至北京时间 2025-02-23 23:59:59,所有用户均可在方舟享受 DeepSeek 模型服务的价格优惠。在此之后,模型价格将恢复至原价。涉及的模型包括:
说明
模型名称 | 计费项 | 性能预估 | 定价 | 计费方式 |
---|---|---|---|---|
Doubao-lite-4k | 模型单元(按小时) | 3000 | 60 | 后付费 |
模型单元(包月) | 3000 | 28000 | 预付费 | |
Doubao-lite-32k | 模型单元(按小时) | 3000 | 60 | 后付费 |
模型单元(包月) | 3000 | 28000 | 预付费 | |
Doubao-lite-128k | 模型单元(按小时) | 4500 | 240 | 后付费 |
模型单元(包月) | 4500 | 112000 | 预付费 | |
Doubao-pro-4k | 模型单元(按小时) | 3200 | 160 | 后付费 |
模型单元(包月) | 3200 | 80000 | 预付费 | |
Doubao-pro-32k | 模型单元(按小时) | 3200 | 160 | 后付费 |
模型单元(包月) | 3200 | 80000 | 预付费 | |
Doubao-pro-128k | 模型单元(按小时) | 3500 | 1200 | 后付费 |
模型单元(包月) | 3500 | 550000 | 预付费 |
方舟会将输入的信息(包括图片)转化为 token 后,进行计量计费。具体用量统计逻辑请参见token 用量说明。
模型名称 | 服务类型 | 定价 | 计费方式 | 免费额度 |
---|---|---|---|---|
Doubao-1.5-vision-pro-32k | 推理服务(输入) | 0.0030 | 后付费 | 50万 |
推理服务(输出) | 0.0090 | 后付费 | ||
Doubao-vision-lite-32k | 推理服务(输入) | 0.0015 | 后付费 | 50万 |
推理服务(输出) | 0.0045 | 后付费 | ||
Doubao-vision-pro-32k | 推理服务(输入) | 0.0030 | 后付费 | 50万 |
推理服务(输出) | 0.0090 | 后付费 |
usage
字段为准。计费定价
模型名称 | 服务类型 | 定价 | 计费方式 | 免费额度 |
---|---|---|---|---|
Doubao-视频生成-Seaweed | 推理服务(输出) | 0.03 | 后付费 | 200万 |
计费示例
画面比例 | 宽 | 高 | 帧率 | 视频时长 | 用量 | 刊例价单价 |
---|---|---|---|---|---|---|
1:1 | 720 | 720 | 24 | 5 | 60,750 | 1.82 |
4:3 | 960 | 720 | 24 | 5 | 81,000 | 2.43 |
16:9 | 1280 | 720 | 24 | 5 | 108,000 | 3.24 |
1:1 | 720 | 720 | 24 | 10 | 121,500 | 3.65 |
4:3 | 960 | 720 | 24 | 10 | 162,000 | 4.86 |
16:9 | 1280 | 720 | 24 | 10 | 216,000 | 6.48 |
说明
Stable-Diffusion 和 Stable-Diffusion-XL 模型卡片暂未完全公开,如需申请使用,请联系与您对接的火山引擎销售人员。
模型 | 计费项 | 支持并发 | 定价 | 计费方式 |
---|---|---|---|---|
豆包-文生图模型-智能绘图 | 推理服务 | 详见控制台 | 0.2 元/次 | 后付费 (免费额度 200 次) |
Stable-Diffusion-1.5 | 模型单元(包天) | 详见控制台 | 175 元/个 | 预付费 |
模型单元(包月) | 详见控制台 | 4200 元/个 | 预付费 | |
Stable-Diffusion-XL | 模型单元(包天) | 详见控制台 | 175 元/个 | 预付费 |
模型单元(包月) | 详见控制台 | 4200 元/个 | 预付费 |
模型 | 服务类型 | 定价 | 计费方式 | 免费额度 |
---|---|---|---|---|
Doubao-语音合成 | 推理服务 | 5 | 后付费 | 5000 |
Doubao-声音复刻 | 推理服务 | 8 | 后付费 | 5000 |
模型 | 服务类型 | 定价 | 计费方式 | 免费额度 |
---|---|---|---|---|
Doubao-embedding | 推理服务(输入) | 0.0005 | 后付费 | 50万 |
Doubao-embedding-large | 推理服务(输入) | 0.0007 | 后付费 | 50万 |
方舟会将输入的信息(包括图片)转化为 token 后,进行计量计费。
说明
图片tokens = (width px * height px)/784,超大图封顶1312 token。
模型 | 服务类型 | 定价 | 计费方式 | 免费额度 |
---|---|---|---|---|
Doubao-embedding-vision | 推理服务(输入) |
| 后付费 | 50万 |
与普通的在线推理有所不同,使用了Session 缓存后,计费项会变更为下面几个计费项:
说明
模型名称 | 输入价格 | 缓存存储 | 缓存命中 | 输出价格 |
---|---|---|---|---|
Doubao-1.5-pro-32k | 0.000800 | 0.000017 | 0.000160 | 0.002000 |
Doubao-1.5-lite-32k | 0.000300 | 0.000017 | 0.000060 | 0.000600 |
Doubao-pro-32k | 0.000800 | 0.000017 | 0.000160 | 0.002000 |
Deepseek-r1-distill-qwen-32b | 0.001500 | 0.000017 | 0.000300 | 0.006000 |
选择了 预付费(按天)付款方式的 TPM 保障包,请注意以下信息:
举例:早上9:00下单,第二天中午12点到期;晚上 21:00 下单,第二天中午12点到期。
满足一天的天数 + 未满一天的时间(超过12:00 a.m.的时间)*1.5
举例:您提前了22小时退订,即下午14点退订,未满一天的时间为2小时。则扣费会计算为
(2小时*1.5+使用天数)*单价
模型 | 计费项 | 输入or输出 | 单价(元) |
---|---|---|---|
Doubao-pro-32k | TPM保障包(小时后付费)- 输入-每10K TPM | 输入 | 1.920 |
TPM保障包(小时后付费)- 输出-每1K TPM | 输出 | 0.480 | |
TPM保障包(包天预付费)- 输入-每10K TPM | 输入 | 23.040 | |
TPM保障包(包天预付费)- 输出-每1K TPM | 输出 | 5.760 |
批量推理计费单价与按 token 使用量付费(后付费)一致。您仅需为已处理的请求消耗的 token 量付费,具体用量可在批量推理任务详情页「Tokens 使用量」查看。
注意
注意批量推理暂不支持使用免费试用额度抵扣。
按 token 使用量(训练文本*训练迭代次数)计费,训练完成后出账,按量后付费。
模型 | 服务类型 | 定价 | 计费方式 |
---|---|---|---|
Doubao-lite-4k | 模型精调(LoRA) | 0.03 | 后付费 |
Doubao-lite-32k | 模型精调(LoRA) | 0.03 | 后付费 |
Doubao-lite-128k | 模型精调(LoRA) | 0.03 | 后付费 |
Doubao-pro-4k | 模型精调(LoRA) | 0.05 | 后付费 |
Doubao-pro-32k | 模型精调(LoRA) | 0.05 | 后付费 |
当前对每个模型设置了 RPM(Requests Per Minute,每分钟请求数)及 TPM(Tokens Per Minute,每分钟 token 数量)的调用限制,每个账号(含主账号下的所有子账号,合并计算)的具体限制可在开通管理页中查看。
如需提升,请联系客户经理或者提交工单。
每个账号会有最多可同时创建运行中的精调任务数的限制,具体限制请见控制台报错提示,若到达上限的,请耐心等待精调任务完成并释放额度后重试,或在配额中心中提交申请更多额度。
使用模型单元创建完成的模型推理接入点,支持对模型单元进行增减购买、到期续费配置调整。7 天内到期的模型单元会出现到期提醒。