使用 API 和 SDK 收费吗?
扣子专业版用户使用扣子 API 和 SDK 时:
- 通过 HTTP 请求或 SDK 调用发起对话等涉及模型交互的 API 时,根据调用次数和 Token 量收取智能体调用费和模型 Token 费用。
- 调用语音合成、语音识别等语音 API 时,根据语音服务的用量收取智能语音费用。
- 使用 Realtime SDK、RTC SDK 时,根据音视频用量收取实时音视频费用。
- 调用查看对话详情等不涉及模型和语音、视频的 API 不会产生任何费用。
调试智能体收费吗?
在扣子平台或其他发布渠道调试或测试智能体时,收取模型费用和智能体调用费。计费说明可参考计费概述。
智能体调用次数是什么?
包括智能体开发者在内的任意用户向智能体发送的一次有效对话请求计为一次智能体调用。其中,多 Agent 模式、工作流模式的智能体仅统计一次调用,不考虑该智能体中包含的 Agent 或大模型节点的数量。
以下行为会产生智能体调用次数:
在哪里购买包年包月实例
包年包月(按峰值计费)模式已下架。
- 曾购买包年包月实例的用户可继续使用现有的实例,也可以通过购买包年包月实例页面购买新的实例、通过控制台续费实例。
- 暂不支持其他用户通过包年包月(按峰值计费)模式使用扣子专业版。
智能体调用的并发量是多少?
在扣子专业版中,智能体调用的并发量取决于以下因素:
- 如果设置了方舟模型的并发量上限,则以此设置为准。添加方舟模型接入点时,如果设置了并发量限制,则任何计费模式下均以此限制为准。你可以在火山方舟的模型推理页面查看指定模型的并发限制。

- 如果未设置方舟模型并发量上限,则以各个计费模式的并发量限制为准。
- 按量计费和资源包模式下,使用 API 或 SDK 时,智能体调用的频控 RPM 为 12000;调试智能体等其他方式调用智能体不限制频率。
- 包年包月模式(按峰值计费)下,并发量限制以购买的 RPM 为准,例如购买的 RPM 为 100,则每分钟可以可以调用 100 次智能体。
控制台提示欠费关停
使用扣子专业版时,如果页面提示当前使用的账号已欠费关停,例如“扣子专业版服务已欠费关停”,建议前往扣子专业版控制台根据页面提示充值,补齐欠款后可以继续使用扣子专业版。

如何关闭扣子专业版
扣子专业版计费模式默认为后付费,如果你不希望继续使用扣子专业版,只需停止使用你搭建的智能体即可停止计费。如果你想直接删除账号下的所有资源,也可以参考以下流程操作:
- 删除你在扣子平台中创建的知识库、工作流、智能体、团队等资源。
注意子用户扣子账号下的资源也需要一并删除。 - (可选)注销火山引擎账号。
操作步骤可参考火山引擎官网文档。
如何查看每轮对话消耗的计费 Token?
你可以在智能体预览与调试页面的对话记录中,查看每轮对话消耗的计费 Token。具体费用,以账单为准。
说明
智能体调试详情区域展示的 Token 数量或调用 API 返回的 Token 数量,仅供参考。
