扣子专业版如何计费?
基于扣子专业版搭建并运行智能体,将会产生两部分费用。
- 用户每次和智能体对话将会产生智能体调用费。
- 智能体处理用户对话请求过程中需要调用大模型服务,将会产生大模型费用。
详细的费用说明可参考计费概述。
使用 API 和 SDK 收费吗?
扣子专业版支持不限频次、不限次数使用扣子 API 和 SDK。其中:
- 通过 HTTP 请求或 SDK 调用发起对话等涉及智能体问答交互的 API 时,默认根据按量计费模式收取智能体调用费。
- 调用查看对话详情等不涉及和智能体问答交互的 API 不会产生任何费用。
调试智能体收费吗?
当使用扣子专业版账号在扣子平台或其他发布渠道调试或测试智能体都会收费。计费说明可参考计费概述。
智能体调用次数是什么?
包括智能体开发者在内的任意用户向智能体发送的一次有效对话请求计为一次智能体调用。其中,多 Agent 模式、工作流模式的智能体仅统计一次调用,不考虑该智能体中包含的 Agent 或大模型节点的数量。
以下行为会产生智能体调用次数:
购买包年包月实例后,可以超出 RPM 使用智能体吗?
包年包月实例生效期间,用户可免费无限次调用智能体,扣子只限制智能体调用的并发量峰值 RPM。超出 RPM 时,超出部分的请求会被服务端拒绝,并返回错误信息。
在哪里购买包年包月实例
包年包月(按峰值计费)模式已下架。
- 曾购买包年包月实例的用户可继续使用现有的实例,也可以通过购买包年包月实例页面购买新的实例、通过控制台续费实例。
- 暂不支持其他用户通过包年包月(按峰值计费)模式使用扣子专业版。
团队空间中的智能体由谁付费?
团队空间中的成员均隶属于统一组织,组织中有且仅有一个扣子专业版主账号。所有成员创建的智能体、工作流、知识库等均为主账号名下的资源,由主账号统一付费。
智能体调用的并发量是多少?
在扣子专业版中,智能体调用的并发量取决于以下因素:
- 如果设置了方舟模型的并发量上限,则以此设置为准。添加方舟模型接入点时,如果设置了并发量限制,则任何计费模式下均以此限制为准。你可以在火山方舟的模型推理页面查看指定模型的并发限制。
- 如果未设置方舟模型并发量上限,则以各个计费模式的并发量限制为准。
- 按量计费和资源包模式下,使用 API 或 SDK 时,智能体调用的频控 RPM 为 12000;调试智能体等其他方式调用智能体不限制频率。
- 包年包月模式(按峰值计费)下,并发量限制以购买的 RPM 为准,例如购买的 RPM 为 100,则每分钟可以可以调用 100 次智能体。