You need to enable JavaScript to run this app.
导航
创建网关访问密钥
最近更新时间:2025.04.08 16:39:58首次发布时间:2024.08.07 11:04:00
我的收藏
有用
有用
无用
无用

本文介绍了如何创建通用网关访问密钥。

前提条件

您已经注册火山引擎账号并完成实名认证。更多信息,请参见实名认证

操作步骤

  1. 登录边缘大模型网关控制台

  2. 在左侧导航栏,单击 网关访问密钥
  3. 通用密钥 标签页,单击 创建网关访问密钥
  4. 完成 创建网关访问密钥 配置向导。
    1. 创建网关访问密钥
      完成以下参数配置,然后单击 下一步
      alt

      区域配置项说明

      基本信息

      名称

      为网关访问密钥设置一个名称。
      您可以使用以下字符:英文字母、数字、汉字、下划线(_)和连字符(-)。请注意以下规则:长度限制在 32 个字符以内。

      描述为网关访问密钥添加描述。长度限制在 128 个字符以内。

      模型选择

      N/A

      从模型列表选择与该网关访问密钥绑定的模型。当使用网关访问密钥时,您只能调用与网关访问密钥绑定的模型。
      可选择的模型来自以下四种渠道:

      • 平台预置模型:可以直接从列表中选择相应模型。更多信息,请参见调用平台预置模型
      • 平台预置智能体:可以直接从列表中选择相应智能体。更多信息,请参见调用平台预置智能体
      • 自有三方模型:需要先创建模型调用渠道,然后可以选择相应模型。更多信息,请参见调用第三方模型
      • 自有三方智能体:需要先添加智能体并创建调用渠道,然后可以选择相应智能体。更多信息,请参见调用第三方智能体

      说明

      请选择与您的使用场景相匹配的模型,不同类型的模型处理能力有差异。例如,多模态模型(Multimodal)可以处理包含图片的请求,而对话模型(Chat)通常无法处理图片。

      推荐使用类型筛选器来获取同类型模型/智能体列表。

      例如,选择类型为 Chat,可以获取具有对话能力的模型/智能体列表;选择类型为 Chat 和 Reasoning,可以获取同时具有对话和推理能力的模型/智能体列表。

  1. 配置调用策略
    完成以下参数配置,然后单击 确定
    alt

    区域配置项说明

    调用策略

    调用顺序

    手动调整上一步选择的模型的顺序。
    前一个模型调用失败后,边缘大模型网关将依次调用后续模型,直到成功调用一个模型。如果所有模型都调用失败,则返回错误响应。

    说明

    请合理设置模型顺序。当一个多模态模型后面是一个对话模型时,可能导致故障切换机制不起作用。

    重试次数

    设置对一个模型进行调用的最大重试次数,取值范围为 0(不重试)~3。
    当一个模型调用失败后,边缘大模型网关将重新尝试调用此模型,直到重试次数耗尽。

    注意

    请留意在不同模型提供商处的使用量。当发生故障切换、重试时,一个请求可能实际触发多次模型调用,导致使用量有所增加。

    高级配置缓存启用状态启用缓存可以让边缘大模型网关缓存调用结果,从而加快重复查询、缩短响应时间并降低成本。

    缓存时长

    仅在 缓存启用状态 开启时,该参数才会出现。
    设置缓存的保留时长。一旦超过指定时长,缓存将被清除。可选项:1分钟5分钟30分钟1小时1天1周

    请求超时定义

    设置单次模型调用的超时时长,单位:毫秒。模型请求发出后,若在超时时长内未收到响应,则判定该请求失败。

    • 如果选择的模型或智能体支持 Reasoning(深度思考),那么请求超时默认值为 300,000 毫秒(5分钟),最大值为 1,800,000 毫秒(30分钟)。
    • 否则请求超时默认值为 60,000 毫秒(1分钟),最大值为 300,000 毫秒(5分钟)。

    请求速率限制

    针对平台预置模型和智能体,设置单模型或智能体的请求速率上限。

    • 对于使用 HTTP 协议的平台预置模型和智能体(如文字识别智能体),可设置每分钟最大请求数(RPM,Requests Per Minute)。默认值:10。取值范围:1~20。
    • 对于使用 WebSocket 协议的平台预置模型和智能体(如语音对话智能体),可设置最大同时连接数。默认值:5。取值范围:1~10。

    说明

    如果默认最大值无法满足业务需求,您可以在网关访问密钥创建成功后,前往 配额中心 申请提升配额。相关操作,请参见申请提升请求速率上限

网关访问密钥创建成功后,您可以在列表中看到新建的网关访问密钥。

后续操作

使用网关访问密钥