在开通管理页页,您可以清晰了解当前商品的开通状态、免费额度消耗情况、推理限额使用情况、推理输入/输出定价、LoRA精调定价、全量精调定价、模型级别限流。可以在当前页面配置开通/关闭服务、查看模型的接入文档。
状态 | 说明 |
---|---|
未开通 | 暂未开通该模型服务,每个模型提供一定额度的免费调用额度,未开通前可使用免费额度,免费额度消耗完后可在开通管理页中开通模型,并继续付费使用,开通服务后仍优先消耗剩余免费额度 |
已开通 | 已正式开通模型服务 |
邀测中 | 当前模型为邀测阶段,暂无法支持自助开通使用,如需正式开通使用的,请提交工单联系我们。 |
每个模型提供一定额度的免费调用量,免费额度消耗完后可在开通管理页中开通模型,并继续付费使用,开通服务后仍优先消耗剩余免费额度。
安心体验模式是针对未开通过模型服务的新用户更方便体验免费额度设计的,可以保障您免费体验模型推理服务,又不产生费用。在安心体验模式下,您调用推理 API 时仅消耗平台赠送的 50w token 免费额度,接近免费额度后服务将暂停,避免产生额外费用。详情请参见 安心体验模式细则说明。
注意
免费额度仅适用于抵扣模型推理消耗的 token(50w 免费 token),不能抵扣使用各类插件、知识库等产生的费用。
推理限额用于解决模型调用 token 量超出预期,产生额外费用的问题。例如:由于推账、服务关停存在一定的时间延迟,而产生预期外的花销。
您可根据需要为目标模型设置推理限额。从限额生效时间起计算(可在相应推理限额值处查看生效时间),达到限额后将自动暂停对应模型服务。请注意评估服务中断的风险。
说明
当前对每个账号下的每个基础模型模型设置了RPM(Requests Per Minute,每分钟请求数)及TPM(Tokens Per Minute,每分钟tokens数量)的调用限制。
说明
如需提升模型级别限流,可提交工单联系我们。
定价详见产品计费文档:产品计费