基于充分、合理的使用需求,您可以通过火山引擎配额中心提交配额扩容申请,以提升平台预置模型和智能体的请求速率上限(包含适用于 HTTP 协议的每分钟最大请求数和适用于 WebSocket 协议的最大同时连接数)。本文介绍了配额扩容申请的条件和操作。
在边缘大模型网关,平台预置模型和智能体有以下请求速率限制:
通过配额扩容申请,HTTP 协议每分钟最大请求数可提升至 200~1000,WebSocket 协议最大同时连接数可提升至 50~100。
注意
实际请求速率限制以网关访问密钥中的配置为准。通过配额扩容申请,可以提升允许配置的最大值。更多信息,请参见创建网关访问密钥。
提交配额扩容申请前,建议您先仔细阅读本文档,检查自己是否满足所有必要条件。这有助于您提交一份完整、高质量的申请,从而提高通过率。
登录火山引擎配额中心控制台。
说明
如果您使用 IAM 用户身份登录,确保您具有配额中心的访问权限。更多信息,请参见 IAM 用户使用资源配额。
在产品列表中选择 边缘智能,然后找到要扩容的配额参数,单击 操作 列的 申请。
相关的配额参数说明如下:
在 配额申请 面板,选择您希望将当前配额提升至的数量(申请配额至)并填写合理的 申请理由,然后单击 提交。
说明
您必须在 申请理由 中提供以下信息:
提交配额扩容申请后,请耐心等待审核结果。您的申请一般会在一个工作日内完成审核。审核结果以站内信形式发送,可在消息中心 > 站内信页面查看。
说明
由于运营成本和服务质量考虑,并非所有的申请都能通过。无论结果如何,我们都将及时告知您,并对您的支持和理解表示感谢。如果申请没有通过,您也可以通过站内信了解失败的理由。