You need to enable JavaScript to run this app.
导航
知识库计费
最近更新时间:2025.01.08 16:15:19首次发布时间:2025.01.08 16:15:19

计费说明

本文介绍知识库产品的计费说明,包括计费方式、计费周期、计费项。

计费方式

注意

以下两种计费方式只能选择其中一种计费方式使用

知识库支持两种计费方式,分别是:

  • 按量计费(后付费),即先使用再付费,费用计入账单内,您可以在账单出账后结算费用;
  • 预付费,即先付费后使用,按订单结算;下单时扣费,不会再出账单。

计费周期

预付费

类型

计费项

周期

是否必买

知识库

计算&离线存储

按月

必买

文本向量模型资源包

按年

必买

Rerank 模型资源包

按年

非必买

大语言模型资源包

按年

非必买

后付费

知识库以 <小时> 为周期统计所有计费项的使用量,并结算生成账单。

注意

创建知识库后,上传文档会触发知识库计算资源的分配和预留,并开始计费,文档删除不影响计算资源占用,若无需使用请主动删除知识库。

计费项

预付费

注意

当资源包用完后,为保障线上业务正常运行,将自动切换为后付费方式

类型

计费项

单价

知识库

计算资源

259元/CU/月

离线存储资源

1.08/GB/月

文本向量模型资源包

2000元/ 5B tokens /年

Rerank 模型资源包

80元/ 0.1B tokens /年

大语言模型资源包

100元/ 1B /年

后付费

计费项

定义

如何计量

单价

计算资源-知识库

使用知识库,构建索引、自动优化分析、线上检索依赖的计算资源。

按 CU(Compute Unit)计量,1 CU 包含的计算资源为 8 GB 内存和 1 CPU Core。
计算公式为 CU = MAX(CPU, MEM / 8),当使用的内存大于8倍的 1 CPU Core 时,CU 用量为消耗内存量除以 8。
例如,32 CU 所包含的计算资源为 256 GB 内存 和 32 CPU Core,若运行 5 小时,则计算费用 = 5 × 32 × 0.45 = 72 元。

0.45 元/CU/小时

离线存储资源-知识库

向量和向量相关的数据属性所需的存储资源。

按占用的 GB 计量。

0.0015 元/GB/小时

文本向量模型-知识库

使用知识库,提供文本向量服务,帮助开发者将文本数据快速转换为向量数据。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0005 元/千tokens

文本向量模型(多功能版)-知识库

使用知识库,提供文本向量服务,帮助开发者将文本数据快速转换为向量数据。支持多语言和长文本,可同时进行稀疏和稠密索引构建和检索。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0005 元/千tokens

文本向量模型(Doubao-embedding)-知识库

使用知识库,提供文本向量服务,帮助开发者将文本数据快速转换为向量数据。字节跳动自研向量化模型,支持中英双语和高精度纯语义检索,支持4k Token的较长输入窗口。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0005元 / 千 tokens

文本向量模型(Doubao- embedding-large)-知识库

使用知识库,提供文本向量服务,帮助开发
者将文本数据快速转换为向量数据。字节跳动自研向量化模型,支持中英双语和高精度纯语义检索。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0007元 / 千Tokens

重排模型-知识库

使用知识库,基于大语言模型对召回结果进行重排序。

按输入 + 输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0008 元/千tokens

大语言模型输入(Doubao-pro-4k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0008 元/千tokens

大语言模型输出(Doubao-pro-4k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0020 元/千tokens

大语言模型输入(Doubao-pro-32k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0008 元/千tokens

大语言模型输出(Doubao-pro-32k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0020 元/千tokens

大语言模型输入(Doubao-pro-128k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0050 元/千tokens

大语言模型输出(Doubao-pro-128k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0090 元/千tokens

大语言模型输入(Doubao-lite-4k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0003 元/千tokens

大语言模型输出(Doubao-lite-4k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0006 元/千tokens

大语言模型输入(Doubao-lite-32k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0003 元/千tokens

大语言模型输出(Doubao-lite-32k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0006 元/千tokens

大语言模型输入(Doubao-lite-128k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0008 元/千tokens

大语言模型输出(Doubao-lite-128k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0010 元/千tokens

大语言模型输入(Doubao-pro-256k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0050 元/千tokens

大语言模型输出(Doubao-pro-256k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0090 元/千tokens

欠费说明

如果您账户中的可用额度(含账户余额和代金券)小于待结算的账单,会被认为欠费,您将会收到余额不足的短信或邮件提醒。本文介绍欠费之后您的资源情况及可执行操作。
请您在欠费 24 小时内充值并结清欠费账单,否则您将不能正常使用向量数据库及知识库服务。
向量数据库及知识库产生欠费后服务状态变化如下:

  • 欠费 24 小时以内,系统将保持正常运行,持续计费。
  • 欠费超过 24 小时不足 168 小时,火山引擎会暂停本服务使用,但仍保留您的数据及相关资源,欠费会继续累积。
  • 当欠费超过 168 小时,视为您主动放弃向量数据库及知识库后付费服务,相关资源、数据将被释放,释放的资源及数据无法恢复。
  • 如您在欠费 168 小时内补缴所有欠费账单后,服务将恢复正常。

税费及发票

除非另有说明,否则火山引擎平台上产品或服务定价均为包含增值税的金额。在服务提供过程中或产品使用期内,如遇国家税收政策调整,导致增值税税率发生变化的,增值税适用税率应按照国家税收政策相应调整,不含税价格保持不变。
我们支持您根据您在火山引擎账户已成功订购的订单和/或已出具的账单金额向您开具等额增值税发票,您可以通过火山引擎控制台-费用中心-发票管理申请增值税发票,我们将在收到您的发票申请后及时向您开具增值税发票。如您使用的服务对应的服务规则与本条约定不一致或双方另有约定的,应适用该等特定服务规则或双方另行约定的条款和条件。针对周期结算服务及具体使用量,公司亦保留要求用户提供资信证明、预付款、保证金或其他公司认为必要的开通和订购条件。
我们将根据您购买的具体产品或服务类型,按照如下发票内容向您开具增值税发票:

产品或服务交付方式

服务期或授权期

发票内容

税率

知识库-公有云版本

以客户实际使用服务期为准

信息技术服务技术服务费

6%