模型 TPM 保障费用--扣子专业版-火山引擎

文档中心

导航

模型 TPM 保障费用

最近更新时间：2025.04.07 17:04:57首次发布时间：2025.04.07 15:58:26

使用扣子模型服务时，如果你是团队版和企业版套餐用户，且默认的模型 TPM （ Tokens per Minute）无法满足企业团队的并发请求，你可以灵活选择购买额外的 TPM 保障服务。

什么是模型 TPM 保障

模型 TPM 保障服务是针对特定模型处理高并发请求的保障服务，确保模型在一定时间内能够处理指定的每分钟 Token 数量（TPM）。该服务采用类似包年包月的计费模式，在保障额度内仅收取固定的 TPM 保障费用。如果实际使用超出 TPM 保障额度，则超出部分按照模型 token 按量计费，模型 token 费用，请参考模型费用。相比单纯的按 token 计费，购买模型 TPM 保障，可以更好地提升模型的并发处理能力。
例如某企业的超级管理员为 Doubao-pro-32k 模型购买了一个小时的 TPM 保障服务，设定模型输入TPM 扩容值为 10000，模型输出 TPM 扩容值为 1000。在实际运行中，在某分钟该大模型的输入为 12000 tokens，输出为 1300 tokens，具体费用包括如下两部分：

一小时 TPM 保障服务：1200 资源点
超额部分：（12000 - 10000）/ 1000 ✖️ 0.8 资源点/千tokens +（1300 - 1000）/ 1000 ✖️ 2 资源点/千tokens = 2.2 资源点

总费用为 1202.2 资源点。

购买说明

仅团队版或企业版的超级管理员或管理员可以购买模型 TPM 扩容保障包。购买后，仅在企业或团队的工作空间范围内生效。
保障服务支持按小时购买，你可以在业务高峰时按小时购买保障服务，贴合流量波峰波谷，避免资源浪费。
保障服务将依据你购买时所指定的保障时间，准时生效。
仅扣子模型支持增购扣子 TPM 保障包，如果是方舟模型，需在火山方舟控制台中购买。具体操作，请参考火山方舟 TPM 保障包。

支持模型

当前如下模型支持购买 TPM 保障服务。

Doubao-pro-32k
Doubao-1.5-vision-pro-32k
Doubao-1.5-pro-32k
Doubao-1.5-lite-32k

单价

模型	计费项	资源点	价格
Doubao-pro-32k	TPM保障额度-每10K（输入）	960 资源点	0.96元
Doubao-pro-32k	TPM保障额度-每1K（输出）	240 资源点	0.24元
Doubao-1.5-vision-pro-32k	TPM保障额度-每10K（输入）	3600 资源点	3.60元
Doubao-1.5-vision-pro-32k	TPM保障额度-每1K（输出）	1080 资源点	1.08元
Doubao-1.5-pro-32k	TPM保障额度-每10K（输入）	960 资源点	0.96元
Doubao-1.5-pro-32k	TPM保障额度-每1K（输出）	240 资源点	0.24元
Doubao-1.5-lite-32k	TPM保障额度-每10K（输入）	360 资源点	0.36元
Doubao-1.5-lite-32k	TPM保障额度-每1K（输出）	72 资源点	0.072元

购买 TPM 保障

在扣子平台的工作空间 > 模型管理页面，单击目标模型。
在并发监控页签下，单击 TPM扩容。
在 TPM 扩容面板中，完成配置与购买。
1. 设置每分钟请求次数，即输入希望保障的请求峰值。
2. 单击自动计算。
  系统将根据用户近 30 天模型的输入和输出 token 均值以及输入的每分钟请求次数给出建议扩容保障的输入和输出 TPM。
3. 确认 TPM 扩容值。
4. 设置保障时间。最低可设置为 1 小时。