不同模型支持的能力及单价各不相同,存在多种计费方式和多种计费逻辑。不同业务类型,适合的服务以及计费方式不同,本文会从计费项目、计费方式、计费逻辑等维度帮助您了解模型服务产生的费用,帮助您规划好费用支出。
模型服务用量的一个重要概念是 token。在调用模型推理服务时,会将输入内容进行分词(tokenize),转化为模型可以理解的 token ,经过模型处理后,同样输出 token,并转化为您需要的文本或者其他内容载体。而模型处理(包括输入、输出)的 token 数量会被作为模型推理服务用量的一个重要计量单位。
如语言大模型推理服务费用的一种较为常见的计算方式如下:
费用 = token 使用数量 * token 单价
说明
下列价格仅供参考,请以定价详情页以及实际购买页价格为准。
按 token 使用量(输入文本+输出文本)计费,每小时出账,按量后付费。
按 token 使用量付费适用于访问豆包大模型以及访问基于豆包大模型精调后的模型。
模型提供方 | 模型 | 上下文长度 | 服务类型 | 定价(单位:元/千 token) | 计费方式 | 免费额度 |
---|---|---|---|---|---|---|
字节跳动 | Doubao-lite-4k | 4K | 推理服务(输入) | 0.0003 | 后付费 | 50 万 token |
推理服务(输出) | 0.0006 | 后付费 | ||||
Doubao-lite-32k | 32K | 推理服务(输入) | 0.0003 | 后付费 | 50 万 token | |
推理服务(输出) | 0.0006 | 后付费 | ||||
Doubao-lite-128k | 128K | 推理服务(输入) | 0.0008 | 后付费 | 50 万 token | |
推理服务(输出) | 0.0010 | 后付费 | ||||
Doubao-pro-4k | 4K | 推理服务(输入) | 0.0008 | 后付费 | 50 万 token | |
推理服务(输出) | 0.0020 | 后付费 | ||||
Doubao-pro-32k | 32K | 推理服务(输入) | 0.0008 | 后付费 | 50 万 token | |
推理服务(输出) | 0.0020 | 后付费 | ||||
Doubao-pro-128k | 128K | 推理服务(输入) | 0.0050 | 后付费 | 50 万 token | |
推理服务(输出) | 0.0090 | 后付费 | ||||
Doubao-pro-256k | 256K | 推理服务(输入) | 0.0050 | 后付费 | 50 万 token | |
推理服务(输出) | 0.0090 | 后付费 | ||||
智谱 AI | GLM3-130B | 8K | 推理服务 | 0.0010 | 后付费 | 50 万 token |
GLM3-130B 金融模型 | 8K | 推理服务 | 0.0010 | 后付费 | 50 万 token | |
月之暗面 | Moonshot-v1-8K | 8K | 推理服务 | 0.0120 | 后付费 | 50 万 token |
Moonshot-v1-32K | 32K | 推理服务 | 0.0240 | 后付费 | 50 万 token | |
Moonshot-v1-128K | 128K | 推理服务 | 0.0600 | 后付费 | 50 万 token | |
Mistral AI | Mistral-7B(开源) | 32K | 推理服务 | 免费限量测试 |
2024 年 9 月,火山方舟调整了模型单元的产品形态,新的模型单元具备:
更多说明,请参见模型单元。
说明
模型名称 | 计费项 | 性能预估 | 定价 | 计费方式 |
---|---|---|---|---|
Doubao-lite-4k | 模型单元(按小时) | 3000 | 60 | 后付费 |
模型单元(包月) | 3000 | 28000 | 预付费 | |
Doubao-lite-32k | 模型单元(按小时) | 3000 | 60 | 后付费 |
模型单元(包月) | 3000 | 28000 | 预付费 | |
Doubao-lite-128k | 模型单元(按小时) | 4500 | 240 | 后付费 |
模型单元(包月) | 4500 | 112000 | 预付费 | |
Doubao-pro-4k | 模型单元(按小时) | 3200 | 160 | 后付费 |
模型单元(包月) | 3200 | 80000 | 预付费 | |
Doubao-pro-32k | 模型单元(按小时) | 3200 | 160 | 后付费 |
模型单元(包月) | 3200 | 80000 | 预付费 | |
Doubao-pro-128k | 模型单元(按小时) | 3500 | 1200 | 后付费 |
模型单元(包月) | 3500 | 550000 | 预付费 |
方舟会将输入的信息(包括图片)转化为 token 后,进行计量计费。具体用量统计逻辑请参见token 用量说明。
模型名称 | 上下文长度 | 服务类型 | 定价(单位:元/千 token) | 计费方式 | 免费额度 |
---|---|---|---|---|---|
Doubao-vision-lite-32k | 32k | 推理服务(输入) | 0.0015 | 后付费 | 50万 token |
推理服务(输出) | 0.0045 | 后付费 | |||
Doubao-vision-pro-32k | 32k | 推理服务(输入) | 0.0030 | 后付费 | 50万 token |
推理服务(输出) | 0.0090 | 后付费 |
说明
Stable-Diffusion 和 Stable-Diffusion-XL 模型卡片暂未完全公开,如需申请使用,请联系与您对接的火山引擎销售人员。
模型提供方 | 模型 | 计费项 | 支持并发 | 定价 | 计费方式 |
---|---|---|---|---|---|
字节跳动 | 豆包-文生图模型-智能绘图 | 推理服务 | 详见控制台 | 0.2 元/次 | 后付费 (免费额度 200 次) |
RunwayML | Stable-Diffusion-1.5 | 模型单元(包天) | 详见控制台 | 175 元/个 | 预付费 |
模型单元(包月) | 详见控制台 | 4200 元/个 | 预付费 | ||
Stability AI | Stable-Diffusion-XL | 模型单元(包天) | 详见控制台 | 175 元/个 | 预付费 |
模型单元(包月) | 详见控制台 | 4200 元/个 | 预付费 |
模型提供方 | 模型 | 服务类型 | 定价(单位:元/万字符) | 计费方式 | 免费额度 |
---|---|---|---|---|---|
字节跳动 | Doubao-语音合成 | 推理服务 | 5 | 后付费 | 5000 字符 |
Doubao-声音复刻 | 推理服务 | 8 | 后付费 | 5000 字符 |
模型提供方 | 模型 | 最长输入长度 | 服务类型 | 定价(单位:元/千 token) | 计费方式 | 免费额度 |
---|---|---|---|---|---|---|
字节跳动 | Doubao-embedding | 4K | 推理服务(输入) | 0.0005 | 后付费 | 50 万 token |
Doubao-embedding-large | 4K | 推理服务(输入) | 0.0007 | 后付费 | 50 万 token |
与普通的在线推理有所不同,使用了Session 缓存后,计费项会变更为下面几个计费项:
输入价格 | 缓存存储 | 缓存命中 | 输出价格 | |
---|---|---|---|---|
Doubao-pro-32k | 0.000800 | 0.000017 | 0.000160 | 0.002000 |
按 token 使用量(训练文本*训练迭代次数)计费,训练完成后出账,按量后付费。
模型提供方 | 模型 | 服务类型 | 定价(单位:元/千 token) | 计费方式 |
---|---|---|---|---|
字节跳动 | Doubao-lite-4k | 模型精调(LoRA) | 0.03 | 后付费 |
Doubao-lite-32k | 模型精调(LoRA) | 0.03 | 后付费 | |
Doubao-lite-128k | 模型精调(LoRA) | 0.03 | 后付费 | |
Doubao-pro-4k | 模型精调(LoRA) | 0.05 | 后付费 | |
Doubao-pro-32k | 模型精调(LoRA) | 0.05 | 后付费 | |
Doubao-pro-128k | 模型精调(LoRA) | 0.05 | 后付费 |
当前对每个模型设置了 RPM(Requests Per Minute,每分钟请求数)及 TPM(Tokens Per Minute,每分钟 token 数量)的调用限制,每个账号(含主账号下的所有子账号,合并计算)的具体限制可在开通管理页中查看。
如需提升,请联系客户经理或者提交工单。
每个账号会有最多可同时创建运行中的精调任务数的限制,具体限制请见控制台报错提示,若到达上限的,请耐心等待精调任务完成并释放额度后重试,或在配额管理中提交申请更多额度。
使用模型单元创建完成的模型推理接入点,支持对模型单元进行增减购买、到期续费配置调整。7 天内到期的模型单元会出现到期提醒。
模型单元调整、续费、退订。
通过【模型推理】列表页,找到需要调整的接入点,点击右侧的 ··· 可以进行调整模型单元、续费、退订。
点击续费按钮,会跳转到费用中心的续费管理页面,可以进行续费操作。
模型单元退订。
想要退订模型单元,进入推理接入点详情页,点击退订。
注意:因为模型单元是按实例组购买的,点击接入点名称详情中复制的模型单元 ID 是实例组 ID,实例组存在强绑定关系,因此续费、退订须同步发起。请注意,未到期的模型单元退订会产生惩罚系数,无法 100%退费。