如果智能体使用豆包大模型,且未来一段时间内的 Token 用量可预估,那么可以按需购买豆包大模型资源包。相较于按量计费模式,豆包大模型资源包的性价比更高。
扣子专业版的智能体默认使用火山引擎方舟模型服务提供的豆包模型。扣子专业版现推出豆包大模型资源包,可抵扣使用大语言模型推理服务时,豆包模型产生的 Token,包括输入 Token 和输出 Token。
说明
使用豆包大模型时产生的 Token 可以通过特定的抵扣系数转换为资源包点数,购买豆包大模型资源包后,系统自动根据抵扣系数从资源包中豆包大模型的 Token 用量。抵扣系数和资源包用量的换算关系为:
资源包用量(点数)= Token 用量 ✖️ 抵扣系数
各个模型的抵扣系数如下:
资源类型 | 抵扣系数 |
---|---|
Doubao-pro-4k-推理服务 |
|
Doubao-pro-32k-推理服务 |
|
Doubao-lite-4k-推理服务 |
|
Doubao-lite-32k-推理服务 |
|
Doubao-pro-128k-推理服务 |
|
Doubao-lite-128k-推理服务 |
|
例如对于使用 Doubao-pro-32k-推理服务 的智能体,调用 1 次智能体时输入 400 tokens,输出 600 tokens,会从资源包中扣减 1.52 点,计算方式为:
400 tokens/1000 × 0.8 (抵扣系数)+ 600 tokens/1000 × 2 (抵扣系数)= 1.52 点
购买豆包大模型资源包后,费用结算时系统优先从资源包中抵扣用量。如果用量超出资源包额度,根据按量计费的价格统计资源用量。你可以在按量付费模式下观察 Token 用量,在业务稳定之后合理评估用量,购买合适额度的资源包。
说明
资源包的规格与定价为:
资源包 | 价格 | 有效期 | 抵扣 Token 数量 |
---|---|---|---|
900点 | 0.9元 | 12个月 | 约100万tokens |
9,000点 | 9元 | 12个月 | 约1000万tokens |
50,000点 | 50元 | 12个月 | 约5500万tokens |
100,000点 | 100元 | 12个月 | 约1.1亿tokens |
说明
输入与输出的 Token 用量取决于智能体使用的模型版本,此处的抵扣 Token 数量仅用于参考。