本文介绍智能体知识库的计费说明,包括计费方式、计费周期、计费项。
知识库当前只支持按量计费,该计费方式为一种后付费方式,即先使用再付费,费用计入账单内,您可以在账单出账后结算费用。
知识库以<小时>为周期统计所有计费项的使用量,并结算生成账单。
注意
创建知识库后,上传文档会触发知识库计算资源的分配和预留,并开始计费,文档删除不影响计算资源占用,若无需使用请主动删除或退订知识库 退订知识库
知识库的计费有三个核心组成部分:计算资源、离线存储资源、大模型调用。其中计算资源和离线存储资源,会在知识库索引构建成功后启动计费,无论是否调用均会以小时维度出账;大模型部分则会按实际调用 tokens 量计费,以小时维度出账,具体计费项以实际功能使用时选择的模型为准。
计费项 | 定义 | 如何计量 | 单价 |
---|---|---|---|
计算资源-知识库 | 使用知识库,构建索引、自动优化分析、线上检索依赖的计算资源 | 按 CU(Compute Unit)计量,1 CU包含的计算资源为 8 GB 内存和 1 CPU Core。 | 0.45 元/CU/小时 |
离线存储资源-知识库 | 向量和向量相关的数据属性所需的存储资源 | 按占用的 GB 计量 | 0.0015 元/GB/小时 |
文本向量模型-知识库 | 使用知识库,提供文本向量服务,帮助开发者将文本数据快速转换为向量数据 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0005 元/千tokens |
文本向量模型(多功能版)-知识库 | 使用知识库,提供文本向量服务,帮助开发者将文本数据快速转换为向量数据。支持多语言和长文本,可同时进行稀疏和稠密索引构建和检索 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0005 元/千tokens |
文本向量模型(豆包 embedding)-知识库 | 提供文本向量服务,帮助开发者将文本数据快速转换为向量数据。字节跳动自研向量化模型,支持中英双语和高精度纯语义检索,支持4k token的较长输入窗口 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0005 元 / 千 tokens |
重排模型-知识库 | 使用知识库,基于大语言模型对召回结果进行重排序 | 按 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个token。 | 0.0008 元/千tokens |
大语言模型输入(Doubao-pro-4k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0008 元/千tokens |
大语言模型输出(Doubao-pro-4k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0020 元/千tokens |
大语言模型输入(Doubao-pro-32k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0008 元/千tokens |
大语言模型输出(Doubao-pro-32k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0020 元/千tokens |
大语言模型输入(Doubao-pro-128k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0050 元/千tokens |
大语言模型输出(Doubao-pro-128k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0090 元/千tokens |
大语言模型输入(Doubao-lite-4k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0003 元/千tokens |
大语言模型输出(Doubao-lite-4k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0006 元/千tokens |
大语言模型输入(Doubao-lite-32k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0003 元/千tokens |
大语言模型输出(Doubao-lite-32k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0006 元/千tokens |
大语言模型输入(Doubao-lite-128k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0008 元/千tokens |
大语言模型输出(Doubao-lite-128k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0010 元/千tokens |
如果您账户中的可用额度(含账户余额和代金券)小于待结算的账单,会被认为欠费,您将会收到余额不足的短信或邮件提醒。本文介绍欠费之后您的资源情况及可执行操作。
请您在欠费 24 小时内充值并结清欠费账单,否则您将不能正常使用知识库服务。
知识库产生欠费后服务状态变化如下: