本文介绍智能体知识库的计费说明,包括计费方式、计费周期、计费项。
注意
以下两种计费方式只能选择其中一种计费方式使用
类型 | 计费项 | 周期 | 是否必买 |
---|---|---|---|
知识库 | 计算&离线存储 | 按月(非自然月) | 必买 |
文本向量模型资源包 | 按年(非自然年) | 必买 | |
Rerank 模型资源包 | 按年 | 非必买 | |
大语言模型资源包 | 按年 | 非必买 |
知识库以<小时>为周期统计所有计费项的使用量,并结算生成账单。
注意
当资源包用完后,为保障线上业务正常运行,将自动切换为后付费方式
类型 | 计费项 | 单价 |
---|---|---|
知识库 | 计算资源 | 259元/CU/月 |
离线存储资源 | 1.08/GB/月 | |
文本向量模型资源包 | 2000元/ 5B tokens /年 | |
Rerank 模型资源包 | 80元/ 0.1B tokens /年 | |
大语言模型资源包 | 100元/ 1B /年 |
注意
创建知识库后,上传文档会触发知识库计算资源的分配和预留,并开始计费,文档删除不影响计算资源占用,若无需使用请主动删除或 退订知识库
知识库的计费有三个核心组成部分:计算资源、离线存储资源、大模型调用。其中计算资源和离线存储资源,会在知识库索引构建成功后启动计费,无论是否调用均会以小时维度出账;大模型部分则会按实际调用 tokens 量计费,以小时维度出账,具体计费项以实际功能使用时选择的模型为准。
计费项 | 定义 | 如何计量 | 单价 |
---|---|---|---|
计算资源-知识库 | 使用知识库,构建索引、自动优化分析、线上检索依赖的计算资源 | 按 CU(Compute Unit)计量,1 CU包含的计算资源为 8 GB 内存和 1 CPU Core。 | 0.45 元/CU/小时 |
离线存储资源-知识库 | 向量和向量相关的数据属性所需的存储资源 | 按占用的 GB 计量 | 0.0015 元/GB/小时 |
文本向量模型-知识库 | 使用知识库,提供文本向量服务,帮助开发者将文本数据快速转换为向量数据 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0005 元/千tokens |
文本向量模型(多功能版)-知识库 | 使用知识库,提供文本向量服务,帮助开发者将文本数据快速转换为向量数据。支持多语言和长文本,可同时进行稀疏和稠密索引构建和检索 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0005 元/千tokens |
文本向量模型(Doubao- embedding)-知识库 | 提供文本向量服务,帮助开发者将文本数据快速转换为向量数据。字节跳动自研向量化模型,支持中英双语和高精度纯语义检索,支持4k token的较长输入窗口 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0005 元 / 千 tokens |
文本向量模型(Doubao-embedding-large)-知识库 | 使用知识库,提供文本向量服务,帮助开发者将文本数据快速转换为向量数据。字节跳动自研向量化模型,支持中英双语和高精度纯语义检索。 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0007 元 / 千Tokens |
重排模型-知识库 | 使用知识库,基于大语言模型对召回结果进行重排序 | 按 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个token。 | 0.0008 元/千tokens |
大语言模型输入(Doubao-pro-4k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0008 元/千tokens |
大语言模型输出(Doubao-pro-4k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0020 元/千tokens |
大语言模型输入(Doubao-pro-32k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0008 元/千tokens |
大语言模型输出(Doubao-pro-32k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0020 元/千tokens |
大语言模型输入(Doubao-pro-128k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0050 元/千tokens |
大语言模型输出(Doubao-pro-128k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0090 元/千tokens |
大语言模型输入(Doubao-lite-4k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0003 元/千tokens |
大语言模型输出(Doubao-lite-4k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0006 元/千tokens |
大语言模型输入(Doubao-lite-32k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0003 元/千tokens |
大语言模型输出(Doubao-lite-32k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0006 元/千tokens |
大语言模型输入(Doubao-lite-128k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0008 元/千tokens |
大语言模型输出(Doubao-lite-128k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0010 元/千tokens |
大语言模型输入(Doubao-pro-256k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输入的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0050 元/千tokens |
大语言模型输出(Doubao-pro-256k)-知识库 | 使用知识库,调用 Doubao 大语言模型服务,根据检索召回的结果生成智能回复。 | 按输出的 tokens 计量。通常 1 个汉字、1 个英文字母、1 个数字或 1 个符号计为 1 个 token。 | 0.0090 元/千tokens |
如果您账户中的可用额度(含账户余额和代金券)小于待结算的账单,会被认为欠费,您将会收到余额不足的短信或邮件提醒。本文介绍欠费之后您的资源情况及可执行操作。
请您在欠费 24 小时内充值并结清欠费账单,否则您将不能正常使用知识库服务。
知识库产生欠费后服务状态变化如下: