You need to enable JavaScript to run this app.
导航
模型 TPM 保障费用
最近更新时间:2025.04.07 17:04:57首次发布时间:2025.04.07 15:58:26
我的收藏
有用
有用
无用
无用

使用扣子模型服务时,如果你是团队版和企业版套餐用户,且默认的模型 TPM ( Tokens per Minute)无法满足企业团队的并发请求,你可以灵活选择购买额外的 TPM 保障服务。

什么是模型 TPM 保障

模型 TPM 保障服务是针对特定模型处理高并发请求的保障服务,确保模型在一定时间内能够处理指定的每分钟 Token 数量(TPM)。该服务采用类似包年包月的计费模式,在保障额度内仅收取固定的 TPM 保障费用。如果实际使用超出 TPM 保障额度,则超出部分按照模型 token 按量计费,模型 token 费用,请参考模型费用。相比单纯的按 token 计费,购买模型 TPM 保障,可以更好地提升模型的并发处理能力。
例如某企业的超级管理员为 Doubao-pro-32k 模型购买了一个小时的 TPM 保障服务,设定模型输入TPM 扩容值为 10000,模型输出 TPM 扩容值为 1000。在实际运行中,在某分钟该大模型的输入为 12000 tokens,输出为 1300 tokens,具体费用包括如下两部分:

  • 一小时 TPM 保障服务:1200 资源点
  • 超额部分:(12000 - 10000)/ 1000 ✖️ 0.8 资源点/千tokens +(1300 - 1000)/ 1000 ✖️ 2 资源点/千tokens = 2.2 资源点

总费用为 1202.2 资源点。

购买说明

  • 仅团队版或企业版的超级管理员或管理员可以购买模型 TPM 扩容保障包。购买后,仅在企业或团队的工作空间范围内生效。
  • 保障服务支持按小时购买,你可以在业务高峰时按小时购买保障服务,贴合流量波峰波谷,避免资源浪费。
  • 保障服务将依据你购买时所指定的保障时间,准时生效。
  • 仅扣子模型支持增购扣子 TPM 保障包,如果是方舟模型,需在火山方舟控制台中购买。具体操作,请参考火山方舟 TPM 保障包

支持模型

当前如下模型支持购买 TPM 保障服务。

  • Doubao-pro-32k
  • Doubao-1.5-vision-pro-32k
  • Doubao-1.5-pro-32k
  • Doubao-1.5-lite-32k

单价

模型

计费项

资源点

价格

Doubao-pro-32k

TPM保障额度-每10K(输入)

960 资源点

0.96元

TPM保障额度-每1K(输出)

240 资源点

0.24元

Doubao-1.5-vision-pro-32k

TPM保障额度-每10K(输入)

3600 资源点

3.60元

TPM保障额度-每1K(输出)

1080 资源点

1.08元

Doubao-1.5-pro-32k

TPM保障额度-每10K(输入)

960 资源点

0.96元

TPM保障额度-每1K(输出)

240 资源点

0.24元

Doubao-1.5-lite-32k

TPM保障额度-每10K(输入)

360 资源点

0.36元

TPM保障额度-每1K(输出)

72 资源点

0.072元

购买 TPM 保障

  1. 扣子平台工作空间 > 模型管理页面,单击目标模型。

  2. 并发监控页签下,单击 TPM扩容

  3. 在 TPM 扩容面板中,完成配置与购买。

    1. 设置每分钟请求次数,即输入希望保障的请求峰值。
    2. 单击自动计算。
      系统将根据用户近 30 天模型的输入和输出 token 均值以及输入的每分钟请求次数给出建议扩容保障的输入和输出 TPM。
    3. 确认 TPM 扩容值。
    4. 设置保障时间。最低可设置为 1 小时。
      Image