创建网关访问密钥--边缘智能-火山引擎

文档中心

立即注册

导航

创建网关访问密钥

最近更新时间：2025.04.08 16:39:58首次发布时间：2024.08.07 11:04:00

本文介绍了如何创建通用网关访问密钥。

前提条件

您已经注册火山引擎账号并完成实名认证。更多信息，请参见实名认证。

操作步骤

登录边缘大模型网关控制台。
在左侧导航栏，单击 网关访问密钥。
在 通用密钥 标签页，单击 创建网关访问密钥。

完成 创建网关访问密钥 配置向导。

创建网关访问密钥。
完成以下参数配置，然后单击 下一步。
alt

区域	配置项	说明
基本信息	名称	为网关访问密钥设置一个名称。您可以使用以下字符：英文字母、数字、汉字、下划线（_）和连字符（-）。请注意以下规则：长度限制在 32 个字符以内。
描述	为网关访问密钥添加描述。长度限制在 128 个字符以内。
模型选择	N/A	从模型列表选择与该网关访问密钥绑定的模型。当使用网关访问密钥时，您只能调用与网关访问密钥绑定的模型。可选择的模型来自以下四种渠道：平台预置模型：可以直接从列表中选择相应模型。更多信息，请参见调用平台预置模型。平台预置智能体：可以直接从列表中选择相应智能体。更多信息，请参见调用平台预置智能体。自有三方模型：需要先创建模型调用渠道，然后可以选择相应模型。更多信息，请参见调用第三方模型。自有三方智能体：需要先添加智能体并创建调用渠道，然后可以选择相应智能体。更多信息，请参见调用第三方智能体。说明请选择与您的使用场景相匹配的模型，不同类型的模型处理能力有差异。例如，多模态模型（Multimodal）可以处理包含图片的请求，而对话模型（Chat）通常无法处理图片。推荐使用类型筛选器来获取同类型模型/智能体列表。例如，选择类型为 Chat，可以获取具有对话能力的模型/智能体列表；选择类型为 Chat 和 Reasoning，可以获取同时具有对话和推理能力的模型/智能体列表。

区域

配置项

说明

基本信息

名称

为网关访问密钥设置一个名称。
您可以使用以下字符：英文字母、数字、汉字、下划线（_）和连字符（-）。请注意以下规则：长度限制在 32 个字符以内。

描述

为网关访问密钥添加描述。长度限制在 128 个字符以内。

模型选择

N/A

从模型列表选择与该网关访问密钥绑定的模型。当使用网关访问密钥时，您只能调用与网关访问密钥绑定的模型。
可选择的模型来自以下四种渠道：

平台预置模型：可以直接从列表中选择相应模型。更多信息，请参见调用平台预置模型。
平台预置智能体：可以直接从列表中选择相应智能体。更多信息，请参见调用平台预置智能体。
自有三方模型：需要先创建模型调用渠道，然后可以选择相应模型。更多信息，请参见调用第三方模型。
自有三方智能体：需要先添加智能体并创建调用渠道，然后可以选择相应智能体。更多信息，请参见调用第三方智能体。

说明

请选择与您的使用场景相匹配的模型，不同类型的模型处理能力有差异。例如，多模态模型（Multimodal）可以处理包含图片的请求，而对话模型（Chat）通常无法处理图片。

推荐使用类型筛选器来获取同类型模型/智能体列表。

例如，选择类型为 Chat，可以获取具有对话能力的模型/智能体列表；选择类型为 Chat 和 Reasoning，可以获取同时具有对话和推理能力的模型/智能体列表。

配置调用策略。
完成以下参数配置，然后单击确定。
alt

区域	配置项	说明
调用策略	调用顺序	手动调整上一步选择的模型的顺序。前一个模型调用失败后，边缘大模型网关将依次调用后续模型，直到成功调用一个模型。如果所有模型都调用失败，则返回错误响应。说明请合理设置模型顺序。当一个多模态模型后面是一个对话模型时，可能导致故障切换机制不起作用。
调用策略	重试次数	设置对一个模型进行调用的最大重试次数，取值范围为 0（不重试）~3。当一个模型调用失败后，边缘大模型网关将重新尝试调用此模型，直到重试次数耗尽。注意请留意在不同模型提供商处的使用量。当发生故障切换、重试时，一个请求可能实际触发多次模型调用，导致使用量有所增加。
高级配置	缓存启用状态	启用缓存可以让边缘大模型网关缓存调用结果，从而加快重复查询、缩短响应时间并降低成本。
	缓存时长	仅在缓存启用状态开启时，该参数才会出现。设置缓存的保留时长。一旦超过指定时长，缓存将被清除。可选项：1分钟、5分钟、30分钟、1小时、1天、1周。
	请求超时定义	设置单次模型调用的超时时长，单位：毫秒。模型请求发出后，若在超时时长内未收到响应，则判定该请求失败。如果选择的模型或智能体支持 Reasoning（深度思考），那么请求超时默认值为 300,000 毫秒（5分钟），最大值为 1,800,000 毫秒（30分钟）。否则请求超时默认值为 60,000 毫秒（1分钟），最大值为 300,000 毫秒（5分钟）。
	请求速率限制	针对平台预置模型和智能体，设置单模型或智能体的请求速率上限。对于使用 HTTP 协议的平台预置模型和智能体（如文字识别智能体），可设置每分钟最大请求数（RPM，Requests Per Minute）。默认值：10。取值范围：1~20。对于使用 WebSocket 协议的平台预置模型和智能体（如语音对话智能体），可设置最大同时连接数。默认值：5。取值范围：1~10。说明如果默认最大值无法满足业务需求，您可以在网关访问密钥创建成功后，前往配额中心申请提升配额。相关操作，请参见申请提升请求速率上限。

网关访问密钥创建成功后，您可以在列表中看到新建的网关访问密钥。

后续操作

使用网关访问密钥