You need to enable JavaScript to run this app.
导航
申请提升请求速率上限
最近更新时间:2025.04.08 10:18:14首次发布时间:2025.04.08 10:18:14
我的收藏
有用
有用
无用
无用

基于充分、合理的使用需求,您可以通过火山引擎配额中心提交配额扩容申请,以提升平台预置模型和智能体的请求速率上限(包含适用于 HTTP 协议的每分钟最大请求数和适用于 WebSocket 协议的最大同时连接数)。本文介绍了配额扩容申请的条件和操作。

申请配额扩容前须知

在边缘大模型网关,平台预置模型和智能体有以下请求速率限制:

  • 对于使用 HTTP 协议通信的平台预置模型和智能体(如文字识别智能体),默认每分钟最大请求数不超过 20。
  • 对于使用 WebSocket 协议通信的平台预置模型和智能体(如语音对话智能体),默认最大同时连接数不超过 10。

通过配额扩容申请,HTTP 协议每分钟最大请求数可提升至 200~1000,WebSocket 协议最大同时连接数可提升至 50~100。

注意

实际请求速率限制以网关访问密钥中的配置为准。通过配额扩容申请,可以提升允许配置的最大值。更多信息,请参见创建网关访问密钥

提交配额扩容申请前,建议您先仔细阅读本文档,检查自己是否满足所有必要条件。这有助于您提交一份完整、高质量的申请,从而提高通过率。

配额扩容的条件

  • 具有充分、合理的使用理由。
    在配额扩容申请中,您必须详细说明自己的使用场景,以供审核时参考。

操作步骤

  1. 登录火山引擎配额中心控制台

    说明

    如果您使用 IAM 用户身份登录,确保您具有配额中心的访问权限。更多信息,请参见 IAM 用户使用资源配额

  2. 在产品列表中选择 边缘智能,然后找到要扩容的配额参数,单击 操作 列的 申请
    相关的配额参数说明如下:

    • ai-gateway-http-rpm:申请提升 HTTP 协议每分钟最大请求数,适用于使用 HTTP 协议通信的平台预置模型和智能体。
    • ai-gateway-websocket-max-threads:申请提升 WebSocket 协议最大同时连接数,适用于使用 WebSocket 协议通信的平台预置模型和智能体。

    alt

  3. 配额申请 面板,选择您希望将当前配额提升至的数量(申请配额至)并填写合理的 申请理由,然后单击 提交

    说明

    您必须在 申请理由 中提供以下信息:

    • 希望进行配额扩容的网关访问密钥 ID
      一次只能为指定的(一个或多个)网关访问密钥申请配额扩容。如果未指定网关访问密钥 ID,您的申请会被拒绝。
    • 详细的使用场景

提交配额扩容申请后,请耐心等待审核结果。您的申请一般会在一个工作日内完成审核。审核结果以站内信形式发送,可在消息中心 > 站内信页面查看。

说明

由于运营成本和服务质量考虑,并非所有的申请都能通过。无论结果如何,我们都将及时告知您,并对您的支持和理解表示感谢。如果申请没有通过,您也可以通过站内信了解失败的理由。