You need to enable JavaScript to run this app.
导航
开通管理
最近更新时间:2025.04.11 17:17:24首次发布时间:2023.10.23 15:54:46
我的收藏
有用
有用
无用
无用

开通管理介绍

开通管理页页,您可以清晰了解当前商品的开通状态、免费额度消耗情况、推理限额使用情况、推理输入/输出定价、LoRA精调定价、全量精调定价、模型级别限流。可以在当前页面配置开通/关闭服务、查看模型的接入文档。

Image

开通状态说明

状态

说明

未开通

暂未开通该模型服务,每个模型提供一定额度的免费调用额度,未开通前可使用免费额度,免费额度消耗完后可在开通管理页中开通模型,并继续付费使用,开通服务后仍优先消耗剩余免费额度

已开通

已正式开通模型服务

邀测中

当前模型为邀测阶段,暂无法支持自助开通使用,如需正式开通使用的,请提交工单联系我们。

免费额度说明

每个模型提供一定额度的免费调用量,免费额度消耗完后可在开通管理页中开通模型,并继续付费使用,开通服务后仍优先消耗剩余免费额度。

安心体验模式说明

安心体验模式是针对未开通过模型服务的新用户更方便体验免费额度设计的,可以保障您免费体验模型推理服务,又不产生费用。在安心体验模式下,您调用推理 API 时仅消耗平台赠送的 50w token 免费额度,接近免费额度后服务将暂停,避免产生额外费用。详情请参见 安心体验模式细则说明

注意

免费额度仅适用于抵扣模型推理消耗的 token(50w 免费 token),不能抵扣使用各类插件、知识库等产生的费用。

推理限额设置

推理限额用于解决模型调用 token 量超出预期,产生额外费用的问题。例如:由于推账、服务关停存在一定的时间延迟,而产生预期外的花销。
您可根据需要为目标模型设置推理限额。从限额生效时间起计算(可在相应推理限额值处查看生效时间),达到限额后将自动暂停对应模型服务。请注意评估服务中断的风险。

说明

  • 控制台显示的免费额度数据存在小时级延迟。如希望通过推理限额来控制仅使用免费额度,建议您设置的限额值尽量小于控制台显示的免费额度剩余值。
  • 仅支持为已开通的、按token后付费的模型设置推理限额。
  • Embedding 模型、视频生成模型、同声传译模型暂不支持设置推理限额。
  • 已存在购买了 TPM 保障包、模型单元的推理接入点的模型,暂不支持设置推理限额。
  • 前缀缓存功能与推理限额功能不支持同时启用。
  • 推理限额值仅可移除或者重新设置,账号下每个模型的推理限额设置需间隔至少 2 小时。

模型级别限流说明

当前对每个账号下的每个基础模型模型设置了RPM(Requests Per Minute,每分钟请求数)及TPM(Tokens Per Minute,每分钟tokens数量)的调用限制。

说明

  1. 依赖同一个基础模型的所有模型推理接入点,共享同一个基础模型的模型级别限流。
  2. 模型调用限制仅包含按照Token后付费的模型调用,不包含购买的模型单元。
  3. 每一个模型推理接入点的限流可以在模型推理接入点的详情页进行自定义配置。

如需提升模型级别限流,可提交工单联系我们。

定价说明

定价详见产品计费文档:产品计费