新功能发布记录--边缘智能-火山引擎

文档中心

导航

新功能发布记录

最近更新时间：2025.04.17 19:27:40首次发布时间：2024.08.07 11:04:00

本文介绍了边缘大模型网关新功能特性的发布动态。

2025年

2025年4月

产品特性	所属模块	功能描述	上线范围	相关文档
支持新的平台预置模型	大模型管理	边缘大模型网关新支持以下平台预置模型： Doubao-1.5-thinking-pro Doubao-1.5-thinking-pro-vision Doubao-1.5-vision-lite Doubao-1.5-vision-pro Doubao-1.5-UI-TARS	全量发布	支持的调用渠道
支持接入新的第三方模型	大模型管理	边缘大模型网关新支持接入以下第三方模型：（字节跳动火山方舟）Doubao-1.5-thinking-pro （字节跳动火山方舟）Doubao-1.5-thinking-pro-vision （字节跳动火山方舟）Doubao-1.5-vision-lite （字节跳动火山方舟）Doubao-1.5-vision-pro （字节跳动火山方舟）Doubao-1.5-UI-TARS	全量发布	支持的调用渠道
支持调用自部署模型	大模型管理	您可以通过边缘大模型网关调用您自己私有化部署的模型。	全量发布	调用自部署模型
支持 HTTP 和 WebSocket 限流	网关访问密钥	在网关访问密钥高级配置中，您可以针对平台预置模型和智能体设置请求速率限制。对于使用 HTTP 协议通信的平台预置模型和智能体（如文字识别智能体），可以设置 HTTP 协议每分钟最大请求数。对于使用 WebSocket 协议通信的平台预置模型和智能体（如语音对话智能体），可以设置 WebSocket 协议最大同时连接数。	全量发布	创建网关访问密钥
支持重置网关访问密钥	网关访问密钥	如果网关访问密钥 API key 不慎泄露，您需要立即重置该密钥。重置网关访问密钥将使当前 API key 失效并重新生成新的 API key。	全量发布	重置网关访问密钥
支持模型/智能体维度的用量统计	网关访问密钥	您可以在网关访问密钥的用量统计中查看调用特定模型或智能体消耗的资源量。	全量发布	用量统计

2025年3月

产品特性	所属模块	功能描述	上线范围	相关文档
支持新的平台预置智能体	智能体管理	边缘大模型网关新支持以下平台预置智能体：组装质检智能体。	全量发布	组装质检智能体
支持端智能密钥	网关访问密钥	端智能密钥是网关访问密钥的一种类型，允许您通过物联网设备调用大模型网关 API，在设备端实现 AI 服务。当您在边缘智能 - 物联网平台成功创建一个端智能实例，系统会自动在边缘大模型网关控制台创建一个与您的实例绑定的端智能密钥。在边缘大模型网关控制台，您可以查看端智能密钥的基本信息、资源用量统计，以及编辑调用策略。	全量发布	端智能密钥

2025年2月

产品特性	所属模块	功能描述	上线范围	相关文档
支持新的平台预置智能体	智能体管理	边缘大模型网关新支持以下平台预置智能体：工业质检智能体、目标检测智能体。	全量发布	工业质检智能体目标检测智能体
支持以 OAuth 访问令牌方式进行扣子智能体访问授权	智能体管理	在边缘大模型网关创建字节跳动扣子智能体调用渠道时，您可以选择使用 OAuth 访问令牌授权（边缘大模型网关）访问您的智能体。相比于使用个人访问令牌进行授权，OAuth 授权方式安全性更高。	全量发布	调用第三方智能体
支持新的平台预置模型	大模型管理	边缘大模型网关新支持以下平台预置模型： Doubao-1.5-pro-32k Doubao-1.5-pro-256k Doubao-1.5-vision-pro-32k Doubao-1.5-lite-32k DeepSeek-V3 DeepSeek-R1 DeepSeek-R1-Distill-Qwen-7B DeepSeek-R1-Distill-Qwen-32B	全量发布	支持的调用渠道
支持接入新的第三方模型	大模型管理	边缘大模型网关新支持接入以下第三方模型：（字节跳动火山方舟）DeepSeek-V3 （字节跳动火山方舟）DeepSeek-R1 （字节跳动火山方舟）DeepSeek-R1-Distill-Qwen-7B （字节跳动火山方舟）DeepSeek-R1-Distill-Qwen-32B （DeepSeek开放平台）DeepSeek-V3 （DeepSeek开放平台）DeepSeek-R1 （阿里云DashScope模型服务灵积）DeepSeek-R1 （阿里云DashScope模型服务灵积）DeepSeek-V3 （阿里云DashScope模型服务灵积）DeepSeek-R1-Distill-Qwen-1.5B （阿里云DashScope模型服务灵积）DeepSeek-R1-Distill-Qwen-7B （阿里云DashScope模型服务灵积）DeepSeek-R1-Distill-Llama-8B （阿里云DashScope模型服务灵积）DeepSeek-R1-Distill-Qwen-14B （阿里云DashScope模型服务灵积）DeepSeek-R1-Distill-Qwen-32B （阿里云DashScope模型服务灵积）DeepSeek-R1-Distill-Llama-70B （硅基流动）DeepSeek-R1 （硅基流动）DeepSeek-V3 （硅基流动）DeepSeek-R1-Distill-Qwen-32B （硅基流动）DeepSeek-R1-Distill-Qwen-14B （硅基流动）DeepSeek-R1-Distill-Llama-8B （硅基流动）DeepSeek-R1-Distill-Qwen-7B （硅基流动）DeepSeek-R1-Distill-Qwen-1.5B （硅基流动）Janus-Pro-7B （腾讯云大模型知识引擎LKE）DeepSeek-V3 （腾讯云大模型知识引擎LKE）DeepSeek-R1 （百度千帆ModelBuilder）DeepSeek-V3 （百度千帆ModelBuilder）DeepSeek-R1 （百度千帆ModelBuilder）DeepSeek-R1-Distill-Qwen-32B （百度千帆ModelBuilder）DeepSeek-R1-Distill-Qwen-14B （百度千帆ModelBuilder）DeepSeek-R1-Distill-Qwen-7B （百度千帆ModelBuilder）DeepSeek-R1-Distill-Qwen-1.5B （百度千帆ModelBuilder）DeepSeek-R1-Distill-Llama-8B （百度千帆ModelBuilder）DeepSeek-R1-Distill-Llama-70B	全量发布	支持的调用渠道

2025年1月

产品特性	所属模块	功能描述	上线范围	相关文档
支持新的平台预置模型	大模型管理	边缘大模型网关新支持以下平台预置模型： Doubao-同声传译	全量发布	支持的调用渠道
支持订阅模型下架消息	大模型管理	边缘大模型网关借助火山引擎消息中心的产品到期通知渠道，向订阅者发送模型下架通知。推荐您订阅模型下架消息，以便及时掌握模型动态。	全量发布	订阅模型下架消息
预置语音对话智能体能力升级	智能体管理	语音对话智能体支持以下新特性：与您在 Coze 平台上搭建的智能体组合使用（后端为Coze）对话可打断未收到语音时返回语音应答	全量发布	语音对话智能体
预置文字识别智能体支持调用预览	智能体管理	文字识别智能体提供了调用预览功能。通过调用预览，您可以在可视化界面中与智能体交互，如上传一张图片，要求智能体按照指示识别其中的文字。	全量发布	语音对话智能体

2024年

2024年12月

产品特性	所属模块	功能描述	上线范围	相关文档
支持新的平台预置模型	大模型管理	边缘大模型网关新支持以下平台预置模型： Doubao-语音合成 Doubao-文生图模型-智能绘图-通用2.0L Doubao-文生图模型-智能绘图-通用2.0S Doubao-vision-pro-32k Doubao-语音识别 Doubao-vision-lite-32k Doubao-Embedding Doubao-Embedding-Large	全量发布	支持的调用渠道
支持模型调用超时设置	网关访问密钥	您可以为网关访问密钥自定义请求超时时间。一次模型调用在超时时间内无响应时，即视为失败。	全量发布	创建网关访问密钥
用量统计页面升级	网关访问密钥	网关访问密钥的用量统计中能够查询以下资源用量数据：tokens、语音时长、调用次数、字符数。	全量发布	用量统计
支持使用平台预置智能体	智能体管理	边缘大模型网关新支持了以下平台预置智能体：语音对话智能体、文字识别智能体。	全量发布	调用平台预置模型及智能体使用语音对话智能体使用文字识别智能体

2024年11月

产品特性	所属模块	功能描述	上线范围	相关文档
支持调用第三方智能体	智能体管理	边缘大模型网关能够调用字节跳动扣子平台的智能体。	全量发布	调用第三方智能体
接入字节跳动火山方舟 - 豆包系列大模型	大模型管理	平台预置模型中新增多款豆包系列大模型，覆盖对话、函数调用等类型。	全量发布	支持的调用渠道

2024年10月

无

2024年9月

产品特性	所属模块	功能描述	上线范围	相关文档
支持数据监控与告警	边缘大模型网关	允许在火山引擎云监控中查看您的网关访问密钥数据报表（支持免费额度用量等指标），并可针对监控指标创建告警策略，主动感知数据变化及异常。	全量发布	数据监控
支持的第三方模型中增加：腾讯-混元、百度-文心一言模型	模型调用密钥	允许添加您在腾讯-混元平台、百度-文心一言平台获得的模型调用密钥，以便通过边缘大模型网关调用相应平台提供的模型。	全量发布	支持的调用渠道
支持调用认证功能	网关访问密钥	允许您在向边缘大模型网关发送的 API 请求中包含经加密的客户端身份认证信息，以及开启高级数据监控功能（在客户端维度查询监控数据）。该功能加白开放。只有白名单中用户可以使用。	白名单	查看代码

2024年8月

产品特性

所属模块

功能描述

上线范围

相关文档

支持缓存配置

边缘大模型网关

针对网关访问密钥，您可以设置是否开启缓存功能。若开启缓存功能，边缘大模型网关会缓存来自模型提供商的响应。
在收到相同请求时，边缘大模型网关将会基于缓存进行响应，而无需重新发起模型调用。缓存机制使您的用户更快获得响应，并节省模型使用量。

全量发布

创建网关访问密钥

支持第三方模型调用

边缘大模型网关

边缘大模型网关允许您添加来自第三方模型提供商的密钥（API Key），以便通过边缘大模型网关来调用第三方模型。需要注意的是：

调用第三方模型将会消耗您在第三方模型提供商平台的额度，不会消耗边缘大模型网关向您提供的免费调用额度（免费调用额度仅限于调用边缘大模型网关的预置模型）。
目前支持的第三方模型提供商及模型有限。

全量发布

支持的调用渠道

2024年7月

产品特性	所属模块	功能描述	上线范围	相关文档
支持调用策略配置	边缘大模型网关	针对网关访问密钥，您可以设置模型调用的策略，包含自动重试次数、模型调用顺序。	全量发布	创建网关访问密钥
产品上线	边缘大模型网关	边缘大模型网关面向所有用户开放免费测试。使用完成实名认证的火山引擎账号，即可创建网关访问密钥，获得预置模型的免费调用额度。	全量发布	什么是边缘大模型网关支持的调用渠道使用说明开始使用边缘大模型网关