说明
此为邀测能力,如需使用,提交测试申请工单。
TPM 保障包 是针对某个特定模型以及版本保障请求并发达到一定 TPM( Tokens per Minute)的计费模式。
除此之外, TPM保障包还具备以下特性:
当前支持两个版本模型:
具体支持的模型以控制台显示为准。
未来会支持视觉理解模型,更多模型版本,如明确需求,可提交工单申请。
它绑定推理接入点,可以为单个接入点提升限流。保障包内限流不包含在账号下模型总限流中,单个接入点超出保障包额度外的流量将与账号下所有接入点共享限流额度。
举例说明:
当前账号下的模型的服务限流 100k TPM,A、B 2 个推理接入点的服务流量分别为 80k TPM,50k TPM。那么您可为 A 推理接入点购买 TPM保障包。
业务预估流量 - 默认服务限流 = 80 + 50 - 100 = 30 k TPM
其中,A 推理接入点业务流量:
TPM保障包支持叠加购买,您可以在 创建推理接入点 时购买。也可以在接入点详情页进行购买、续费、退订等操作。
如果您无法购买,请按照控制台上的提示提交工单申请。
如果您无法购买,请按照控制台上的提示提交工单申请。
详细配置参数请参见配置参数说明
配置名称 | 配置说明 |
---|---|
计费类型 | 条件必填,当启用了 TPM保障包时,需要选择。TPM保障包的计费方式,包括 后付费,预付费:
|
购买额度 | 条件必填,当启用了 TPM保障包时,需要选择。TPM保障包的额度,请根据界面提示进行选择。 |
购买时长 | 条件必填,当启用了 TPM保障包时,需要选择。TPM保障包的购买时长。 |
自动续费 | 可选,推荐您进行选择,保障服务持续可用。 |
单次自动续费时长 | 条件必填,当启用了 TPM保障包自动续费时,需要填写。触发自动续费时,为您自动购买的TPM保障包时长。 |
自动续费次数 | 条件必选,当启用了 TPM保障包自动续费时,需要选择。默认为永久生效,您可以根据业务填写自定义次数。 |
预付费方式请关注扣费逻辑,具体请参见计费逻辑。
单价请参见TPM 保障包。
您可以使用火山引擎消息通知服务(后简称 SNS) 来感知TPM保障包信息通知的字段如下。
2100444922
ark
ModelTPMNewFailed
、ModelTPMScaleUpFailed
。{ "Type": "SubscriptionConfirmation", "MessageId": "f11b9a8f-****", "TopicTrn": "trn:sns:cn-beijing:2100000825:topic/test", "Message": "You have chosen to subscribe to the topic trn:sns:cn-beijing:2100000825:topic/wyy_test. To confirm the subscription, visit the SubscribeURL included in this message.", "Timestamp": "2025-01-14T07:18:59Z", "SignatureVersion": "1", "Signature": "MEUCIB3NsKw***=", "SigningCertURL": "https://sns-public-cn-beijing.tos-cn-beijing.volces.com/certificates/cn-beijing-a31d91fc-0683-****.pem", "SubscribeToken": "eyJhbGciOiJIUzI1Ni****", "SubscribeURL": "https://sns.cn-beijing.volcengineapi.com?Action=ConfirmSubscription&Version=2023-01-01&Token=eyJhbGc***" }
TPM保障包订阅失败时通知的内容。
{ "EventID": "tpmro-202502111****-****", "EventName": "ModelTPMNewFailed", "EventTime": "2025-02-11T19:41:36+08:00", "AccountID": 2100000825, "ModelTPMInfo": { "EndpointID": "ep-2025021******-cn***", "FoundationModelName": "doubao-lite-4k" } }
{ "EventID": "tpmro-202502111****-****", "EventName": "ModelTPMScaleUpFailed", "EventTime": "2025-02-11T19:41:36+08:00", "AccountID": 2100000825, "ModelTPMInfo": { "EndpointID": "ep-20250******-cn***", "FoundationModelName": "doubao-lite-4k" } }