You need to enable JavaScript to run this app.
导航
知识库计费
最近更新时间:2024.12.16 15:43:10首次发布时间:2024.05.14 16:59:32

计费说明

本文介绍智能体知识库的计费说明,包括计费方式、计费周期、计费项。

计费方式

注意

以下两种计费方式只能选择其中一种计费方式使用

  • 知识库支持两种计费方式,分别是
    • 按量计费(后付费),即先使用再付费,费用计入账单内,您可以在账单出账后结算费用
    • 预付费,即先付费后使用,按订单结算**;**下单时扣费,不会再出账单

计费周期

预付费

类型

计费项

周期

是否必买

知识库

计算&离线存储

按月(非自然月)

必买

文本向量模型资源包

按年(非自然年)

必买

Rerank 模型资源包

按年

非必买

大语言模型资源包

按年

非必买

后付费

知识库以<小时>为周期统计所有计费项的使用量,并结算生成账单。

计费项

预付费

注意

当资源包用完后,为保障线上业务正常运行,将自动切换为后付费方式

类型

计费项

单价

知识库

计算资源

259元/CU/月

离线存储资源

1.08/GB/月

文本向量模型资源包

2000元/ 5B tokens /年

Rerank 模型资源包

80元/ 0.1B tokens /年

大语言模型资源包

100元/ 1B /年

后付费

注意

创建知识库后,上传文档会触发知识库计算资源的分配和预留,并开始计费,文档删除不影响计算资源占用,若无需使用请主动删除或 退订知识库

知识库的计费有三个核心组成部分:计算资源、离线存储资源、大模型调用。其中计算资源和离线存储资源,会在知识库索引构建成功后启动计费,无论是否调用均会以小时维度出账;大模型部分则会按实际调用 tokens 量计费,以小时维度出账,具体计费项以实际功能使用时选择的模型为准。

计费项

定义

如何计量

单价

计算资源-知识库

使用知识库,构建索引、自动优化分析、线上检索依赖的计算资源

按 CU(Compute Unit)计量,1 CU包含的计算资源为 8 GB 内存和 1 CPU Core。
例如,32 CU所包含的计算资源为 256 GB 内存和 32 CPU Core,若运行 5 小时,则计算费用 = 5×32×0.45 =72元。

0.45 元/CU/小时

离线存储资源-知识库

向量和向量相关的数据属性所需的存储资源

按占用的 GB 计量

0.0015 元/GB/小时

文本向量模型-知识库

使用知识库,提供文本向量服务,帮助开发者将文本数据快速转换为向量数据

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0005 元/千tokens

文本向量模型(多功能版)-知识库

使用知识库,提供文本向量服务,帮助开发者将文本数据快速转换为向量数据。支持多语言和长文本,可同时进行稀疏和稠密索引构建和检索

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0005 元/千tokens

文本向量模型(Doubao- embedding)-知识库

提供文本向量服务,帮助开发者将文本数据快速转换为向量数据。字节跳动自研向量化模型,支持中英双语和高精度纯语义检索,支持4k token的较长输入窗口

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0005 元 / 千 tokens

文本向量模型(Doubao-embedding-large)-知识库

使用知识库,提供文本向量服务,帮助开发者将文本数据快速转换为向量数据。字节跳动自研向量化模型,支持中英双语和高精度纯语义检索。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0007 元 / 千Tokens

重排模型-知识库

使用知识库,基于大语言模型对召回结果进行重排序

按 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个token。

0.0008 元/千tokens

大语言模型输入(Doubao-pro-4k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0008 元/千tokens

大语言模型输出(Doubao-pro-4k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0020 元/千tokens

大语言模型输入(Doubao-pro-32k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0008 元/千tokens

大语言模型输出(Doubao-pro-32k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0020 元/千tokens

大语言模型输入(Doubao-pro-128k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0050 元/千tokens

大语言模型输出(Doubao-pro-128k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0090 元/千tokens

大语言模型输入(Doubao-lite-4k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0003 元/千tokens

大语言模型输出(Doubao-lite-4k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0006 元/千tokens

大语言模型输入(Doubao-lite-32k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0003 元/千tokens

大语言模型输出(Doubao-lite-32k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0006 元/千tokens

大语言模型输入(Doubao-lite-128k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0008 元/千tokens

大语言模型输出(Doubao-lite-128k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0010 元/千tokens

大语言模型输入(Doubao-pro-256k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0050 元/千tokens

大语言模型输出(Doubao-pro-256k)-知识库

使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。

按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。

0.0090 元/千tokens

欠费说明

如果您账户中的可用额度(含账户余额和代金券)小于待结算的账单,会被认为欠费,您将会收到余额不足的短信或邮件提醒。本文介绍欠费之后您的资源情况及可执行操作。
请您在欠费 24 小时内充值并结清欠费账单,否则您将不能正常使用知识库服务。
知识库产生欠费后服务状态变化如下:

  • 欠费 24 小时以内,系统将保持正常运行,持续计费。
  • 欠费超过 24 小时不足 168 小时,火山引擎会暂停本服务使用,但仍保留您的数据及相关资源,欠费会继续累积。
  • 当欠费超过 168 小时,视为您主动放弃知识库后付费服务,相关资源、数据将被释放,释放的资源及数据无法恢复。
  • 如您在欠费 168 小时内补缴所有欠费账单后,服务将恢复正常。