火山引擎-云上增长新动力

立即注册

定价详情

价格计算器

价格清单

0￥***

当前您处于未登录状态，仅可查看刊例价

选择服务

售卖模式

大语言模型

按tokens使用量（输入文本+输出文本）计费，每小时出账，按量后付费。豆包模型分别提供50万tokens免费推理额度，详见产品计费文档

模型提供方	模型	上下文长度	服务类型	定价（单位：元/千tokens）

字节跳动	Doubao1.5-vision-pro-32k（输入）	32k	推理（输入）	-
字节跳动	Doubao1.5-vision-pro-32k（输出）	32k	推理（输出）	-
字节跳动	Doubao1.5-vision-pro-32k（批量输入）	32k	批量推理（输入）	-
字节跳动	Doubao1.5-vision-pro-32k（批量输出）	32k	批量推理（输出）	-
字节跳动	Doubao1.5-pro-256k（输入）	256k	推理（输入）	-
字节跳动	Doubao1.5-pro-256k（输出）	256k	推理（输出）	-
字节跳动	Doubao1.5-pro-256k（批量输入）	256k	批量推理（输入）	-
字节跳动	Doubao1.5-pro-256k（批量输出）	256k	批量推理（输出）	-
字节跳动	Doubao1.5-pro-32k（输入）	32k	推理（输入）	-
字节跳动	Doubao1.5-pro-32k（输出）	32k	推理（输出）	-
字节跳动	Doubao1.5-pro-32k（批量输入）	32k	批量推理（输入）	-
字节跳动	Doubao1.5-pro-32k（批量输出）	32k	批量推理（输出）	-
字节跳动	Doubao1.5-lite-32k（输入）	32k	推理（输入）	-
字节跳动	Doubao1.5-lite-32k（输出）	32k	推理（输出）	-
字节跳动	Doubao1.5-lite-32k（批量输出）	32k	批量推理（输入）	-
字节跳动	Doubao1.5-lite-32k（批量输入）	32k	批量推理（输出）	-
字节跳动	Doubao-vision-pro-32k（输入）	32k	推理（输入）	-
字节跳动	Doubao-vision-pro-32k（输出）	32k	推理（输出）	-
字节跳动	Doubao-vision-lite-32k（输入）	32k	推理（输入）	-
字节跳动	Doubao-vision-lite-32k（输出）	32k	推理（输出）	-
字节跳动	Doubao-pro-256k（输入）	256k	推理（输入）	-
字节跳动	Doubao-pro-256k（输出）	256k	推理（输出）	-
字节跳动	Doubao-pro-256k（批量输入）	256k	批量推理（输入）	-
字节跳动	Doubao-pro-256k（批量输出）	256k	批量推理（输出）	-
字节跳动	Doubao-pro-128k（输入）	128k	推理（输入）	-
字节跳动	Doubao-pro-128k（输出）	128k	推理（输出）	-
字节跳动	Doubao-pro-128k（批量输入）	128k	批量推理（输入）	-
字节跳动	Doubao-pro-128k（批量输出）	128k	批量推理（输出）	-
字节跳动	Doubao-pro-32k（输入）	32k	推理（输入）	-
字节跳动	Doubao-pro-32k（输出）	32k	推理（输出）	-
字节跳动	Doubao-pro-32k（批量输入）	32k	批量推理（输入）	-
字节跳动	Doubao-pro-32k（批量输出）	32k	批量推理（输出）	-
字节跳动	Doubao-pro-4k（输入）	4k	推理（输入）	-
字节跳动	Doubao-pro-4k（输出）	4k	推理（输出）	-
字节跳动	Doubao-pro-4k（批量输出）	4k	批量推理（输入）	-
字节跳动	Doubao-pro-4k（批量输入）	4k	批量推理（输出）	-
字节跳动	Doubao-lite-128k（输入）	128k	推理（输入）	-
字节跳动	Doubao-lite-128k（输出）	128k	推理（输出）	-
字节跳动	Doubao-lite-128k（批量输入）	128k	批量推理（输入）	-
字节跳动	Doubao-lite-128k（批量输出）	128k	批量推理（输出）	-
字节跳动	Doubao-lite-32k（输入）	32k	推理（输入）	-
字节跳动	Doubao-lite-32k（输出）	32k	推理（输出）	-
字节跳动	Doubao-lite-32k（批量输入）	32k	批量推理（输入）	-
字节跳动	Doubao-lite-32k（批量输出）	32k	批量推理（输出）	-
字节跳动	Doubao-lite-4k（输入）	4k	推理（输入）	-
字节跳动	Doubao-lite-4k（输出）	4k	推理（输出）	-
字节跳动	Doubao-lite-4k（批量输入）	4k	批量推理（输入）	-
字节跳动	Doubao-lite-4k（批量输出）	4k	批量推理（输出）	-
深度求索	DeepSeek-V3（输入）	64k	推理（输入）	-
深度求索	DeepSeek-V3（输出）	64k	推理（输出）	-
深度求索	DeepSeek-V3（批量输入）	64k	批量推理（输入）	-
深度求索	DeepSeek-V3（批量输出）	64k	批量推理（输出）	-
深度求索	DeepSeek-R1（输入）	64k	推理（输入）	-
深度求索	DeepSeek-R1（输出）	64k	推理（输出）	-
深度求索	DeepSeek-R1（批量输入）	64k	批量推理（输入）	-
深度求索	DeepSeek-R1（批量输出）	64k	批量推理（输出）	-
深度求索	DeepSeek-R1-D-Qwen32B（输入）	32k	推理（输入）	-
深度求索	DeepSeek-R1-D-Qwen32B（输出）	32k	推理（输出）	-
深度求索	DeepSeek-R1-D-Qwen32B（批量输入）	32k	批量推理（输入）	-
深度求索	DeepSeek-R1-D-Qwen32B（批量输出）	32k	批量推理（输出）	-
深度求索	DeepSeek-R1-D-Qwen7B（输入）	32k	推理（输入）	-
深度求索	DeepSeek-R1-D-Qwen7B（输出）	32k	推理（输出）	-
深度求索	DeepSeek-R1-D-Qwen7B（批量输入）	32k	批量推理（输入）	-
深度求索	DeepSeek-R1-D-Qwen7B（批量输出）	32k	批量推理（输出）	-
月之暗面	Moonshot-v1-8k	8k	推理	-
月之暗面	Moonshot-v1-32k	32k	推理	-
月之暗面	Moonshot-v1-128k	128k	推理	-
智谱AI	GLM3-130B	8k	推理	-
智谱AI	GLM3-130B金融模型	8k	推理	-

视觉大模型

图像大模型：若您未正式开通，体验额度200次，QPS限制为1；正式开通后QPS限制为2，按调用次数计费，有额外QPS需求可增购QPS

视频大模型：视频生成模型按输出tokens计费，图生视频、文生视频同价。生成不同时长、不同画面尺寸的视频，将消耗不同数量的tokens

模型提供方	模型名称	单价	单位（元/次）	免费额度

字节跳动	豆包-文生图模型-智能绘图	-	次	200次
字节跳动	豆包-文生图模型-智能绘图（漫画版）	-	次	200次
字节跳动	Doubao-视频生成(图生视频)-Seaweed	-	千tokens	200万tokens
字节跳动	Doubao-视频生成(文生视频)-Seaweed	-	千tokens	200万tokens

语音大模型

语音合成和声音复刻模型卡片暂未完全公开，如需申请使用，请提交工单联系我们

模型提供方	模型	服务类型	定价（单位：元/万字符）	免费额度

字节跳动	语音合成大模型	推理服务	5	5000 字符
字节跳动	声音复刻大模型	推理服务	8	5000 字符

向量模型

模型提供方	模型	最长输入长度	服务类型	定价（单位：元/千tokens）	免费额度

字节跳动	Doubao-embedding	4K	推理服务	-	50万tokens
字节跳动	Doubao-embedding-large	4K	推理服务	-	50万tokens
字节跳动	Doubao-embedding-vision（文本输入）	8k	推理服务	-	50万tokens
字节跳动	Doubao-embedding-vision（图像输入）	8k	推理服务	-	50万tokens

模型精调

按tokens使用量（训练文本*训练迭代次数）计费，训练完成后出账，按量后付费。

模型提供方	模型	服务类型	定价（单位：元/千tokens）

字节跳动	Doubao-lite-4k	模型精调（LoRA）	-
字节跳动	Doubao-lite-32k	模型精调（LoRA）	-
字节跳动	Doubao-lite-128k	模型精调（LoRA）	-
字节跳动	Doubao-pro-4k	模型精调（LoRA）	-
字节跳动	Doubao-pro-32k	模型精调（LoRA）	-
字节跳动	Doubao-pro-128k	模型精调（LoRA）	-

大语言模型

模型单元是调用某个特定模型的 TPM（Tokens Per Minute，每分钟tokens数量）配额，购买后无需再为 Tokens 消耗付费，详细使用说明请见查看并管理模型推理接入点

模型提供方	模型	预计可承载性能（TPS）	定价（单位：元/个）	计费方式

字节跳动	Doubao-lite-4k（按小时）	3000	60	后付费
字节跳动	Doubao-lite-4k（包月）	3000	28000	预付费
字节跳动	Doubao-lite-32k（按小时）	3000	60	后付费
字节跳动	Doubao-lite-32k（包月）	3000	28000	预付费
字节跳动	Doubao-lite-128k（按小时）	4500	240	后付费
字节跳动	Doubao-lite-128k（包月）	4500	112000	预付费
字节跳动	Doubao-pro-4k（按小时）	3200	160	后付费
字节跳动	Doubao-pro-4k（包月）	3200	80000	预付费
字节跳动	Doubao-pro-32k（按小时）	3200	160	后付费
字节跳动	Doubao-pro-32k（包月）	3200	80000	预付费
字节跳动	Doubao-pro-128k（按小时）	3500	1200	后付费
字节跳动	Doubao-pro-128k（包月）	3500	550000	预付费

视觉大模型

Stable-Diffusion和Stable-Diffusion-XL模型卡片暂未完全公开，如需申请使用，请提交工单联系我们

模型提供方	模型	定价（单位：元/个）

RunwayML	Stable-Diffusion-1.5（包天）	175
RunwayML	Stable-Diffusion-1.5（包月）	4200
Stability AI	Stable-Diffusion-XL（包天）	175
Stability AI	Stable-Diffusion-XL（包月）	4200

知识库

知识库的计费有三个核心组成部分：计算资源、离线存储资源、大模型调用。其中计算资源和离线存储资源，会在知识库索引构建成功后启动计费，无论是否调用均会以小时维度出账；大模型部分则会按实际调用 tokens 量计费，以小时维度出账，具体计费项以实际功能使用时选择的模型为准，详见产品计费文档

计算资源

计费项	定义	如何计量	单价	单位

计算资源-知识库

使用知识库时，构建索引、自动优化分析、线上检索依赖的计算资源

按 CU（Compute Unit）计量，1 CU包含的计算资源为 8 GB 内存和 1 CPU Core。例如，32 CU所包含的计算资源为 256 GB 内存和 32 CPU Core，若运行 5 小时，则计算费用 = 5×32×0.45 =72元。

元/CU/小时

离线存储资源

计费项	定义	如何计量	单价	单位

离线存储资源-知识库

向量和向量相关的数据属性所需的存储资源

按占用的 GB 计量

元/GB/小时

大模型调用

计费项	定义	如何计量	单价	单位

文本向量模型-知识库	使用知识库，提供文本向量服务，帮助开发者将文本数据快速转换为向量数据。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千Tokens
文本向量模型（多功能版）-知识库	使用知识库，提供文本向量服务，帮助开发者将文本数据快速转换为向量数据。支持多语言和长文本，可同时进行稀疏和稠密索引构建和检索。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千Tokens
文本向量模型（豆包embedding）-知识库	使用知识库，提供文本向量服务，帮助开发者将文本数据快速转换为向量数据。字节跳动自研向量化模型，支持中英双语和高精度纯语义检索。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千Tokens
文本向量模型（豆包embedding-large）-知识库	使用知识库，提供文本向量服务，帮助开发者将文本数据快速转换为向量数据。字节跳动自研向量化模型，支持中英双语和高精度纯语义检索。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千Tokens
大语言模型输入（Doubao-pro-256k）-知识库	使用知识库，调用 Doubao 大语言模型服务，根据检索召回的结果生成智能回复。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千Tokens
大语言模型输出（Doubao-pro-256k）-知识库	使用知识库，调用 Doubao 大语言模型服务，根据检索召回的结果生成智能回复。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千Tokens
大语言模型输入（Doubao-pro-128k）-知识库	使用知识库，调用 Doubao 大语言模型服务，根据检索召回的结果生成智能回复。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千Tokens
大语言模型输出（Doubao-pro-128k）-知识库	使用知识库，调用 Doubao 大语言模型服务，根据检索召回的结果生成智能回复。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千Tokens
大语言模型输入（Doubao-pro-32k）-知识库	使用知识库，调用 Doubao 大语言模型服务，根据检索召回的结果生成智能回复。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千Tokens
大语言模型输出（Doubao-pro-32k）-知识库	使用知识库，调用 Doubao 大语言模型服务，根据检索召回的结果生成智能回复。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千Tokens
大语言模型输入（Doubao-lite-128k）-知识库	使用知识库，调用 Doubao 大语言模型服务，根据检索召回的结果生成智能回复。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千Tokens
大语言模型输出（Doubao-lite-128k）-知识库	使用知识库，调用 Doubao 大语言模型服务，根据检索召回的结果生成智能回复。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千Tokens
大语言模型输入（Doubao-lite-32k）-知识库	使用知识库，调用 Doubao 大语言模型服务，根据检索召回的结果生成智能回复。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千Tokens
大语言模型输出（Doubao-lite-32k）-知识库	使用知识库，调用 Doubao 大语言模型服务，根据检索召回的结果生成智能回复。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千Tokens

联网内容插件

使用插件可能会产生大语言模型额外tokens消耗费用，详见产品计费文档

官方组件名称	计费说明	单价	单位	免费额度

联网资源	支持实时搜索互联网公开域内容	-	元/次	2万次/月
头条资源	支持实时搜索今日头条图文内容，并提供内容详情信息供展示交互卡片	-	元/次	无
抖音资源	支持实时搜索抖音视频、抖音百科内容，并提供内容详情信息供展示交互卡片	-	元/次	无
墨迹天气	支持实时搜索墨迹天气内容资源	-	元/次	无

向量库

注：向量库的计费有三个核心组成部分：计算资源、离线存储资源、大模型调用。其中计算资源和离线存储资源，会在向量库库索引构建成功后启动计费，无论是否调用均会以小时维度出账；大模型部分则会按实际调用 tokens 量计费，以小时维度出账，具体计费项以实际功能使用时选择的模型为准，可以多选。详见向量库计费文档

计费项	定义	如何计费	单价	单位

计算资源	构建索引、自动优化分析、线上检索依赖的计算资源。	按 CU（Compute Unit）计量，1 CU 包含的计算资源为 8 GB 内存和 1 CPU Core。计算公式为 CU = MAX（CPU, MEM / 8），当使用的内存大于8倍的 1 CPU Core 时，CU 用量为消耗内存量除以 8。例如，32 CU 所包含的计算资源为 256 GB 内存和 32 CPU Core，若运行 5 小时，则计算费用 = 5 × 32 × 0.45 = 72 元。	-	元/CU/小时
离线存储资源	向量和向量相关的数据属性所需的存储资源。	按占用的 GB 计量。	-	元/GB/小时
文本向量模型（Doubao-embedding-large）	提供文本向量服务，帮助开发者将文本数据快速转换为向量数据。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千tokens
文本向量模型（Doubao-embedding）	提供文本向量服务，帮助开发者将文本数据快速转换为向量数据。支持多语言和长文本，可同时进行稀疏和稠密索引构建和检索。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千tokens
图文向量模型	提供文本向量服务，帮助开发者将文本数据快速转换为向量数据。以豆包语言模型为基座。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千tokens
文本向量模型（多功能版）	提供文本向量服务，帮助开发者将文本数据快速转换为向量数据。采用能力更强的豆包语言模型为基座。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千tokens
文本向量模型	提供图文向量服务，帮助开发者将文本数据快速转换为向量数据。可对文本或图片进行单独编码，或者对文本图片对联合编码，输出1024维的稠密向量。	按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。	-	元/千tokens

火山引擎定价模块仅作为商品规格和价格的参考，具体可购买的商品规格及费用请以实际下单结果为准。

一键开启云上增长新空间

立即注册