以下为您介绍联网系列插件的计费方式、计费组成及各插件具体计费项:
联网系列插件当前支持按量计费后付费的计费方式,按照实际使用量付费。
内容源调用次数:用户调用内容源执行请求的次数。单一用户问题将根据内容源搜索范围设定及对话意图判断,触发一次或多次内容源搜索调用。调用次数费用 = 调用次数 × 单价
额外tokens消耗费用:使用插件可能会产生大语言模型额外tokens消耗费用
联网Pro版保底消费:联网Pro版存在保底消费,详情请咨询业务对接人员
插件扩容:插件默认限流为1QPS、60RPM,如有插件扩容需求请联系我们
插件 | 计费说明 | 付费方式 | 默认限流 | 价格 |
---|---|---|---|---|
联网基础版 | 使用该插件可能产生模型更多tokens消耗 | 按量计费后付费 | 1QPS | 限时免费 |
联网Plus版 | 根据内容源搜索范围设定及对话意图判断,每次插件调用可能触发一次或多次内容源搜索,每千次内容源搜索将产生6元费用。使用中可能会产生额外的模型tokens消费。 | 按量计费后付费 | 1QPS | 6 元/千次搜索 |
联网Pro版 | 根据内容源搜索范围设定及对话意图判断,每次插件调用可能触发一次或多次内容源搜索,每千次内容源搜索将产生6元费用。使用中可能会产生额外的模型tokens消费。此外,联网pro版存在保底消费。 | 按量计费后付费(存在保底消费) | 1QPS | 6 元/千次搜索 |
每次插件调用产生的内容源调用次数,可通过调用时输出的 action_usage 信息了解。
账号下插件调用产生的费用,可通过 火山引擎控制台-费用中心-账单详情 了解,本系列插件对应产品为 火山方舟大模型服务平台-插件服务 。