使用扣子模型服务时,如果你是团队版和企业版套餐用户,且默认的模型 TPM ( Tokens per Minute)无法满足企业团队的并发请求,你可以灵活选择购买额外的 TPM 保障服务。
模型 TPM 保障服务是针对特定模型处理高并发请求的保障服务,确保模型在一定时间内能够处理指定的每分钟 Token 数量(TPM)。该服务采用类似包年包月的计费模式,在保障额度内仅收取固定的 TPM 保障费用。如果实际使用超出 TPM 保障额度,则超出部分按照模型 token 按量计费,模型 token 费用,请参考模型费用。相比单纯的按 token 计费,购买模型 TPM 保障,可以更好地提升模型的并发处理能力。
例如某企业的超级管理员为 Doubao-pro-32k 模型购买了一个小时的 TPM 保障服务,设定模型输入TPM 扩容值为 10000,模型输出 TPM 扩容值为 1000。在实际运行中,在某分钟该大模型的输入为 12000 tokens,输出为 1300 tokens,具体费用包括如下两部分:
总费用为 1202.2 资源点。
当前如下模型支持购买 TPM 保障服务。
模型 | 计费项 | 资源点 | 价格 |
---|---|---|---|
Doubao-pro-32k | TPM保障额度-每10K(输入) | 960 资源点 | 0.96元 |
TPM保障额度-每1K(输出) | 240 资源点 | 0.24元 | |
Doubao-1.5-vision-pro-32k | TPM保障额度-每10K(输入) | 3600 资源点 | 3.60元 |
TPM保障额度-每1K(输出) | 1080 资源点 | 1.08元 | |
Doubao-1.5-pro-32k | TPM保障额度-每10K(输入) | 960 资源点 | 0.96元 |
TPM保障额度-每1K(输出) | 240 资源点 | 0.24元 | |
Doubao-1.5-lite-32k | TPM保障额度-每10K(输入) | 360 资源点 | 0.36元 |
TPM保障额度-每1K(输出) | 72 资源点 | 0.072元 |
在扣子平台的工作空间 > 模型管理页面,单击目标模型。
在并发监控页签下,单击 TPM扩容。
在 TPM 扩容面板中,完成配置与购买。