在使用扣子智能体或应用时,通常需要调用大模型处理问题,例如在工作流中使用大模型节点或进行知识库召回等场景。不同的模型收费规则不同。本文档介绍通过扣子平台使用模型服务时会涉及的费用。
通过扣子平台使用模型服务时,可以根据模型的接入方对模型进行分类,分为扣子模型和方舟模型。如何区分模型类型,可参考如何在扣子平台中区分扣子模型和火山模型。
模型类型 | 说明 | 费用 |
---|---|---|
扣子模型 | 由扣子统一对接、面向所有扣子用户提供的模型服务,均为扣子模型。通常来说,除火山方舟以外的模型,均为扣子模型。 |
|
方舟模型 | 由专业版用户在火山方舟侧通过创建接入点的方式自行接入的模型,被称为方舟模型。 | 根据模型 Token 用量从账号中扣减对应的金额。模型 Token 单价可参考火山方舟文档。 |
扣子豆包模型服务根据模型的 token 使用量计费,计费公式如下:
豆包模型服务费 = token 使用量 ✖️ 模型 token 单价
说明
在大语言模型中,token 是文本处理的基本单位,模型通常将输入文本分解成一系列 token,然后对这些 token 进行处理和分析。token 可以是单词、字符、子词片段或其他形式的文本片段,具体的划分方式取决于模型使用的分词算法,所以 token 的计算和处理方式可能会根据模型的具体架构和设计而有所不同。
每个模型 token 的单价不同,具体如下:
模型名称 | 计费项 | 资源点 | 单价 |
---|---|---|---|
豆包·通用模型·Pro、 | Doubao-pro-32k 推理服务(输入) | 0.8 资源点 | 0.0008 元 |
Doubao-pro-32k 推理服务(输出) | 2 资源点 | 0.0020 元 | |
豆包·Pro·1.5·32k | Doubao-1.5-pro-32k 推理服务(输入) | 0.8 资源点 | 0.0008 元 |
Doubao-1.5-pro-32k 推理服务(输出) | 2 资源点 | 0.0020 元 | |
豆包·Pro·1.5·256k | Doubao-1.5-pro-256k 推理服务(输入) | 5 资源点 | 0.0050 元 |
Doubao-1.5-pro-256k 推理服务(输出) | 9 资源点 | 0.0090 元 | |
豆包·通用模型·Lite·128k | Doubao-lite-128k 推理服务(输入) | 0.8 资源点 | 0.0008 元 |
Doubao-lite-128k 推理服务(输出) | 1 资源点 | 0.0010 元 | |
豆包·通用模型·Lite | Doubao-lite-32k 推理服务(输入) | 0.3 资源点 | 0.0003 元 |
Doubao-lite-32k 推理服务(输出) | 0.6 资源点 | 0.0006 元 | |
豆包·视觉理解·Pro | Doubao-vision-pro-32k 推理服务(输入) | 3 资源点 | 0.0030 元 |
Doubao-vision-pro-32k 推理服务(输出) | 9 资源点 | 0.0090 元 | |
豆包·视觉理解·Lite | Doubao-vision-lite-32k 推理服务(输入) | 1.5 资源点 | 0.0015 元 |
Doubao-vision-lite-32k 推理服务(输出) | 4.5 资源点 | 0.0045 元 |
扣子专业版提供全新的扣子资源包,资源包中包含不同数量的资源点,可抵扣包括扣子模型在内的多种扣子服务及资源费用,包括输入 Token 和输出 Token。详细说明可参考扣子资源包。
扣子专业版用户可通过火山引擎方舟大模型服务平台接入模型资源,如果你在火山方舟创建了模型接入点,在扣子中使用方舟模型,火山方舟模型服务产生的 Token 费用,由火山方舟服务收取。
方舟模型服务通过大语言模型的 Token 使用量计费,计费公式为:
方舟模型服务费 = Token 使用量 ✖️ 模型 Token 单价
如果账号中仍有未过期或未使用完的方舟豆包大模型资源包,可抵扣使用火山方舟模型推理服务时,部分豆包模型产生的 Token,包括输入 Token 和输出 Token。详细说明可参考豆包大模型资源包(已下架)。
注意,此资源包已下架且不支持续购,建议关注火山方舟的其他促销活动。
在智能体或工作流大模型节点中选择模型时,如果模型分类展示为**火山方舟 | 由字节跳动提供
,表示这个分类下的模型为方舟模型。除火山方舟以外的模型,均为扣子模型。
例如,以下标记了火山方舟**的模型即为火山模型,除此以外均为扣子模型。
在智能体或工作流大模型节点的模型区域,展开模型列表即可切换模型,详细操作可参考如何切换模型?。
如果将火山方舟模型切换为扣子模型: