本文介绍了火山方舟大模型服务平台的新版本产品功能特性,欢迎体验。
模型更新信息请见:模型发布公告
Release Note - 20241213
功能模块 | 功能说明 | 帮助文档 |
---|
体验中心 | - 图片内容理解模型体验优化迭代,包括:
- 展示tokens数量,包括输入框中显示总tokens值,和在每轮对话中提示消耗tokens值
- 支持用户根据使用场景选择vlm模型的高细节理解或低细节理解模式
- 在上传图片方式中增加“URL上传”,用户可直接复制图片URL后导入输入框
| 体验中心 |
模型推理 | - 批量推理任务支持重启
- 批量推理支持Doubao-lite-32k|240828
- 支持通过创建接入点进行批量推理(需填写工单申请使用)
- 提供一种相比在线访问几乎无改造量的批量推理接入方式
- 用户无需处理数据,通过平台提供的SDK直接调用模型接口实现批量推理
| 在线推理 |
用量统计 | - 用量统计通过OpenAPI形式支持,客户可以通过GetUsage发起调试查看用量数据
| 用量统计 |
安全与信任 | | 推理会话数据应用层加密方案 |
- 在接入点安全审计页面中,展示会话数据加密/未加密状态
- 在数据协作计划产品界面和用户协议中透出安全方案
- 优化推理和精调安全审计界面的监控看板
| 审计日志API文档 |
Release Note - 20241126
功能模块 | 功能说明 | 帮助文档 |
---|
体验中心 | - 文本模型界面功能升级,包括:
- 支持AI自动总结标题
- 支持返回“体验中心首token延迟时间”,直观对比各模型推理延迟
- 优化长文本场景下体验(输入框和页面新增滑动条,输出侧新增“一键回底部”按钮)
- 图片内容理解模型(该模型需填写工单申请试用)体验优化迭代,包括:
- 支持至多50张图片的上传体验(实际上限以图片所占用的上下文窗口为准)
- 支持将图片直接复制粘贴至输入框
- 页面提供丰富场景示例,支持一键发送体验
- 视觉模型界面功能升级,AI视频生成结果支持视图切换及筛选
| 体验中心 |
在线推理 | - 支持 Doubao-lite 系列模型购买并开通 TPM 保障包,该保障包为高流量业务提供资源保障,适用于大流量、流量大小可预估且对生产级高 SLA 有要求的场景
| 在线推理 |
智能体 | - 旧版联网插件(基础版、plus版、pro版)支持一键升级为新版联网内容插件。原联网基础版、联网plus版、联网pro版插件将于2024年12月24日18:00下线
- 零代码智能体功能迭代与体验优化,包括:
- 零代码智能体的rerank重排默认链路调整
- 支持用户在零代码智能体中使用图片内容理解模型上传图片或图片链接进行问答
- 零代码群聊智能体支持以API参数的方式动态进行角色和场景配置
优化智能体 API 调用示例,展示了多种语言版本,支持智能体的快速调用 | 智能体中心 |
- 新版联网内容插件进行了全方位升级,丰富内容源并实现链路优化,与最新豆包大模型配合使用效果提升。原联网基础版、联网plus版、联网pro版插件将于2024年12月24日18:00起停止服务,不再支持调用。更多信息详见 升级说明文档,如有任何问题,请随时联系我们。
- 网页解析插件升级,支持word、excel等更多格式
| 服务组件库 |
数据集 | - 新增 文本向量化-SFT精调 数据格式
- 优化数据格式组织方式,更清晰地展示各数据格式的用途
| 数据集 |
安全与信任 | - 在线推理和模型精调的安全审计页面和审计日志API更新:
- 沙箱连接日志区分连接状态
- 增加通过主机堡垒机登录沙箱的日志
- 沙箱登录日志,新增字段透出沙箱的登录方式,帮助用户定位是否是违规登录
| 审计日志API文档 |
Release Note - 20241029
功能模块 | 功能说明 | 帮助文档 |
---|
模型推理 | - 优化推理接入点监控面板,展示推理接入点的全局运行情况,新增TPM、RPM及成功率等指标
- 推理接入点详情页可展示关联智能体的信息,并支持通过该页面快速创建智能体
| 创建推理接入点(Endpoint) |
智能体 | 零代码智能体发布后,支持查看其调用统计数据,包括智能体调用量、智能体调用tokens数以及插件调用量指标 | 智能体中心 |
安全与信任 | 在精调或创建数据集过程中:当用户选择上传数据集时,平台为该数据集自动开启SSE-TOS加密,保证数据在TOS密文存储,更安全;当用户选择从TOS导入时,引导用户为该数据集自行开启SSE-TOS加密 | |
数据集 | - 数据集模块对全量用户开放可见
- 支持模型精调使用数据集
- 支持数据集版本管理功能
- 支持数据集共享能力
| 共享数据集 |
Release Note - 20241015
功能模块 | 功能说明 | 帮助文档 |
---|
模型广场 | 在Doubao-pro聚合页新增256k模型 | 模型广场介绍 |
体验中心 | 长输入文本情况下交互体验优化,默认定位到输出内容 | 体验中心介绍 |
智能体 | 上线 ASR+LLM+TTS 官方智能体demo,如需获取最佳实践可 联系我们 | 智能体中心 |
服务组件库 | 插件新增抖音百科内容源 | 联网系列功能说明 |
模型推理 | 支持批量推理输入文件大小配额提升,可以提交工单申请更大的文件大小上限(最大 8 GiB) | 创建推理接入点(Endpoint) |
安全与信任 | 审计日志 API 支持精调相关日志 | 安全审计日志 |
- 精调流程安全可视化:
- 精调任务详情页面中增加安全审计 tab 页,展示精调数据流程图和精调安全日志,增加安全可信度
- 精调任务列表页面增加安全沙箱标识,点击后可查看精调安全技术演示动画,帮助用户理解精调数据流转路径中的安全概念
| |
Release Note - 20240924
功能模块 | 功能说明 | 帮助文档 |
---|
体验中心 | - 体验中心「语音模型」新增语音识别(支持方言)体验能力,可上传音频文件或实时录音识别语音
- 体验中心「语音模型」新增同声传译体验,支持中文与英文的同声传译,其中译文音色为复刻声音
- 体验中心「视觉模型」新增AI视频体验,支持图片生成视频与文本生成视频
- 体验中心「视觉模型」新增文生图的模型体验,支持文本生成图片
| 体验中心介绍 |
智能体 | | 智能体中心 |
模型推理 | | 创建推理接入点(Endpoint) |
Release Note - 20240914
功能模块 | 功能说明 | 帮助文档 |
---|
新用户引导 | 在模型精调、模型仓库、模型评测、在线推理、批量推理等页面上方,新增模块介绍和引导 | |
模型广场 | 模型详情页优化,更清晰展示版本特性、价格、快捷操作入口等,并新增同类模型的聚合页 | 模型广场介绍 |
体验中心 | 同一模型的多个对话体验,可各自设置独立的参数配置 | 体验中心介绍 |
智能体 | 新增零代码智能体system prompt优化功能,支持用户一键快速优化并降低编写门槛
智能体提示词system prompt最大长度限制升级扩展到10000字
联网系列插件三合一升级为联网内容插件,新用户可在零代码智能体中使用。支持联网和内容源按需选择且支持与知识库混合使用。插件开通后,即可赠送每月2万次联网资源的免费额度,头条、天气等内容源资源按使用量后付费。 | 智能体中心 |
模型评测 | 自动评测增加裁判员模型评测
支持xls、xlsx格式评测集上传以及结果批量导出 | 模型评测体系介绍 |
在线推理 | 模型单元改为实例型独占资源模式,支持按小时付费 | 创建推理接入点(Endpoint) |
安全与信任 | 安全审计日志API新增功能:支持按时间筛选日志,新增返回风险等级和日志细节等信息
ChatCompletions接口的审核支持 n 参数:当模型的 n 路 response 同时送审时,只针对被拦截的 response 进行拒答文案替换,其余 response 正常放行 | 安全审计日志 |
Release Note - 20240903
功能模块 | 功能说明 | 帮助文档 |
---|
模型广场 | 新增模型广场厂商视图,更清晰地展示同一厂商的模型家族全貌及各模型的结构化信息 | 模型广场介绍 |
智能体 | - 新增零代码智能体自助Debug功能,支持对单轮执行完成的会话进行调试
- 零代码智能体功能迭代与体验优化,包括:
- 智能体中心新增“AI生成智能体”功能,支持用户一键创建并体验智能体效果
- 对话体验支持本地PDF文件上传
| 智能体中心 |
Release Note - 20240820
功能模块 | 功能说明 | 帮助文档 |
---|
体验中心 | - 新增豆包语音合成模型的体验
- 支持一键副本当前话题为新话题,并保留已选模型及相关参数配置
| 体验中心 |
智能体 | - 插件并发超限时将触发兜底策略
- 当插件并发超限时,系统会提示出错,并将对应插件的参考资料设置为空,但保留原配置
- 可通过自定义prompt,来调整是否需要回答参考资料为空时的问题
- 联网+知识库同时使用参考资料增加资料来源标签
- 联网/知识库-自定义回答方式增加使用示例与样式优化
| 智能体 |
用量统计 | - 用量统计看板拆分展示调用总tokens数、输入总tokens数、输出总tokens数
- 支持查看所选服务下具体接入点的相关调用量
| 用量统计 |
安全与信任 | - 接入点详情页面中增加安全审计标签页:
- 该标签页中有安全总览指标、推理流程图、审计日志,帮助用户了解推理是否安全
| / |
| |
Release Note - 20240806
功能模块 | 功能说明 | 帮助文档 |
---|
体验中心 | 新增豆包声音复刻大模型体验 | 体验中心 |
模型推理 | - 支持批量推理。适用于无需实时响应的推理场景,可以一次性离线处理大量数据。
- Chat API v3 更新:支持 presence_penalty/frequency_penalty
- 增加安全沙箱标识,点击可弹出推理安全方案演示动画
| 批量推理 大模型调用ChatCompletions |
智能体中心 | - 优化联网改写/总结prompt模版
- 智能体SearchSummary action透出联网reference
- 高代码智能体assistant api支持方舟apikey鉴权
| 智能体中心 |
Release Note - 20240723
功能模块 | 功能说明 | 帮助文档 |
---|
模型广场 | - 新增豆包语音合成模型
- 模型详情页版本列表按分组展示
- Doubao Embedding 模型的模型卡片与相应示例代码更新至 API V3
| 模型广场 |
体验中心 | - 增加智能体体验,用户可在“体验插件和模型应用”标签下选择体验示例智能体模版
| 体验中心 |
评测任务 | - 系统评测集和个人评测集会过审核机制,审核策略与用户自定义配置保持一致
| 模型评测 |
模型精调 | - 优化了精调列表页的视觉交互体验,展示状态等重点信息
| 创建精调任务 |
模型推理 | - 原「模型推理」模块更名为「在线推理」,优化模型接入点限频说明
| 创建推理接入点 |
智能体中心 | - 知识库新增命中测试功能并支持用户调整大模型问答测试有关参数
- 智能体群聊功能上线,支持用户通过 GUI 选择多个智能体进行角色扮演
- 优化智能体对话界面的报错交互与文案
- 高代码智能体部署与开通流程简化
- 支持一键开通基础依赖服务
- 提供一键开通和一键加白的 API 接口,以及基于 API 接口的一键开通按钮
| 智能体中心 |
开通管理 | - 增加豆包语音合成模型开通项
- 用户可通过开通管理页面产品入口授权提升免费额度,免费额度内的数据会被收集用于模型训练
| 开通管理 |
安全与信任 | - 支持通过OpenAPI查看安全沙箱登录和连接记录的审计日志
| 获取安全审计日志 |
其他 | - 精调、评测、模型仓库等模块,数据集和模型文件上传到 TOS 时,按项目进行管理
| |
Release Note - 20240708
功能模块 | 功能说明 | 帮助文档 |
---|
模型推理 | - 支持智谱 GLM3 / GLM4 模型的 function call 协议适配
- 模型推理 API V3 已修复部分细节问题(如报错处理、参数范围和默认值调整等)
| API调用指南 |
体验中心 | - 体验中心界面交互优化如下:
- 体验中心-历史对话的话题区分项目,便于用户管理使用
- 支持选择已创建的模型推理接入点( Endpoint )进行体验
| 体验中心 |
模型精调 | - 增加精调任务资源预占功能:为排队第一且排队时间远大于平台均值的任务自动开启资源预占
- 模型仓库新增「增量训练」操作按钮,支持用户一键增量训练
- 优化模型精调报错交互,增加显著的提示入口及明确的失败原因,提升用户体验
| 模型精调 |
智能体 | - 新增支持网页解析插件:
- 使用前需在服务组件库进行开通,限时免费
- 当前不支持与其他插件同时开启使用
- 联网插件链路部分升级,其中包括:
- 支持多风格 Prompt 模板选择及自定义,可通过零代码创建的“联网插件-高级配置-回答配置”进行选择
- 联网Plus版引用条数上限从5增加至10
- 优化联网插件的意图识别环节链路
- 透传userinfo(用户当前的时间和地点) 以提升模型回复正确率与效果
- 知识库插件链路部分升级:
- 支持多风格Prompt模板选择及自定义,可通过零代码创建的“知识库插件-高级配置-回答配置”进行选择
- BotApi V3 API文档 / SDK调用指南 已上线
- Chatapi V3 已支持 Function calling 能力,支持用户将外部工具或 API 接入大模型,使用说明详见文档
| 智能体中心 |
Release Note - 20240625
功能模块 | 功能说明 | 帮助文档 |
---|
模型广场 | 新增“Doubao-声音复刻”,“Doubao-语音合成”,“豆包-文生图模型-智能绘图”模型,支持模型接入 | 模型广场 |
智能体 | - 新增计算器插件(beta版本,如需使用请提交工单联系我们)
- 当用户点击选择更多插件时支持添加计算器插件
- 组件可多选,请注意:计算器插件和联网/知识库不可同时开启
- 计算器插件限时免费,无需额外开通
- 智能体中心支持插件限流调整:支持以账户纬度的插件限流调整
| 智能体中心 |
Release Note - 20240605
功能模块 | 功能说明 | 帮助文档 |
---|
模型推理 | - 模型调用SDK版本升级,SDK V3新增支持Java、Golang语言。
- 模型推理 API/SDK V3支持功能升级,新支持embedding和function call功能,包含Python、Java、Golang 三种语言。
- 优化模型推理API调用说明,为所有推理接入点提供详细的获取授权方式说明,以及不同代码语言和不同场景切换的API调用示例。
- API key的鉴权方式升级,平台支持长效API key的创建和管理,减少因API key失效而频繁更换的麻烦。其中包括:
- API key的创建:用户可通过界面化形式为不同项目创建API key,
all 权限默认给予项目下所有资源访问权限。API key当前生效于推理服务(endpoint)、智能体(bot)、智能体组件(action)。 - API key的调用:调用方式与OpenAI SDK完全对齐。用户只需将API key替换为方舟的API key,即可调用方舟上的模型。
- 短效API key仍然可用,适用于对安全有更严格管理要求的用户。
| 模型调用API |
智能体 | - 智能体广场新发布联网、联网+内容、知识库三种插件的示例智能体及prompt优化大师示例智能体。
- 智能体体验和开发升级,其中包括:
- 智能体体验模块增加水印。
- 智能体体验时前端会带入当前ip的城市区域信息。
- 智能体的提示词放大到3000字。
- 高代码智能体开发指南进一步为用户补充操作信息,包括:更清晰的代码示例、vefaas部署引导。
- 0代码智能体创建将面向个人开发者开放,并在流程上进一步丰富提示信息,包括:零代码操作指南及说明文案,模型接入点创建说明,其他提示文案等。
- 联网及内容插件升级,用户可自定义联网触发条件和强制联网开启,调用方式默认为自动调用。
| 智能体中心 |
Release Note - 20240515
功能模块 | 功能说明 | 帮助文档 |
---|
模型广场 | - 基础模型版本管理升级,让每个模型版本的可调参数和配置都以更清晰的方式展示,以便帮助您快速地选择适合您需求的基础模型;
- 引入全新的精选模型卡片,包括字节豆包APP应用的同系列豆包大模型等,为您提供更多选择,以满足各种业务场景的需求;
| 模型广场介绍 |
体验中心 | - 在体验中心可以添加“模型仓库”的模型,通过直接与精调模型问答,以更直观的方式感受精调效果;
- 多模型对比模式开启后,可以同时同步对比“精调模型”与“基础模型”的差异,以及来自不同模型提供方、不同特性的模型在相同问答场景下的回复;
- 新增prompt优化选项,让大模型配合您提供更准确、更具情境感的指导词,使大模型在角色塑造和任务场景中提供更优质的回复;
- 支持图片上传,结合豆包大模型对图片理解的能力,以实现更贴切、更精准的回复,为您带来更优的体验;
| 模型体验介绍 |
模型仓库 | - 新发布模型仓库,现在您可以通过模型仓库更好地管理精调模型;
- 同时,以模型为中心,您可以发起增量训练、发起效果评测、创建推理服务等,以满足您持续迭代和持续运维的需求;
| 模型仓库介绍 |
模型精调 | - 精调任务中新增了“模型产出”列表,使您可以更轻松地追溯和管理同一精调任务在不同训练阶段的多个模型产出;
- 成功完成的训练任务会自动将最终模型产出录入至模型仓库,而失败的训练任务则允许您从中断位置继续训练,确保您能够充分利用资源,提高训练效率;
| 模型精调介绍 |
模型推理 | - 算力保障现提供两种选项:公共资源池和模型单元。您可以从实际业务和场景出发,选择一种或灵活组合多个不同的推理服务,以实现稳定性和性价比的综合最优解;
- 我们对模型推理限流进行了调整:之前每个模型接入点需单独申请限流额度,现改为模型维度的限流。即在同一账号内,不同接入点现在共享一个限流额度,这使得单个接入点可以访问的额度更高。同时,您还可以根据需要灵活分配每个接入点的限流;
| 模型推理介绍 |
智能体 | - 新发布智能体中心,为不同开发偏好的用户提供了三种开发模式,使得从零技术基础的用户到初级开发者和高级开发者均能轻松参与到基于AI模型的智能体开发中;其中包括:
- 0代码模式:通过界面点选支持分钟级搭建问答Bot,并可搭配官方预置的联网或知识库组件,获得更高时效性和准确度的模型答复;
- 低代码模式:通过方舟 x 扣子的联动支持轻量级编排,同时也将生态内容和多渠道发布的一站式开发体验连接至企业客户;
- 高代码模式:通过Ark SDK为开发工具支持最大自由度的AI应用服务编排体验,不仅限于问答Bot;
- 新发布服务组件库,支持官方组件的添加和自定义组件创建,从而提高智能体的开发效率。首次发布的官方组件包括可扩展头条图文、抖音视频等优质内容源的联网组件,以及可高效联动企业私域知识进行可靠性补充的知识库组件;
- 新发布知识库,用于私域数据问答的场景,支持导入指定链接或TOS中存储的多个文档,并自动对文档执行解析、切片、向量化、构建索引等处理流程。为智能体提供可快速更新、定制化的知识,提升回答准确性。
| 智能体中心 |
资源管理 | - 完整对接项目管理和资源标签。账号管理员可基于自身企业的组织和业务设置更加精细的资源管理。同时,您可以通过项目或资源标签从不同维度对方舟上的任务、服务、资产进行分类和聚合管理,将其用于标签制授权和资源分账等场景;
| 资源管理平台 |
OpenAPI | - 新发布模型广场、模型仓库、模型精调、模型服务、智能体等平台基础功能模块的 OpenAPI,让您能够更灵活地集成和管理方舟平台,满足各种定制化需求和业务场景;
- 升级模型调用Chat API,和多个辅助型API(Tokenization/Classification等)组合使用,可以更好的对模型问答内容进行调整
- 在AK/SK鉴权模式上,新增API Key鉴权,让豆包大模型能在更多的应用侧被便捷的调用;
- 开放logit_bias参数,用于调整模型生成的输出中某些内容出现的可能性。配合Tokenization API 可将文本分词并生成相应的 token ID 和偏移量(offset),这些信息有助于在文本中定位每个 token 的位置;
- Chat API还同步开放了诸多新的参数
| OpenAPI介绍 |
安全与信任 | - 方舟平台在数据安全、隐私和合规性方面已完成并通过多个国内外权威机构(如ISO和SOC)的安全合规认证,为您提供可靠的保障;
- 新增用户数据加密能力,加固保护方舟平台的数据安全性。默认情况下使用火山引擎密钥管理系统(KMS)为您加密您的精调资产;
| 火山方舟互信计算架构白皮书 数据加密 |
Release Note - 20231214
功能模块 | 功能说明 | 帮助文档 |
---|
模型接入 | 模型接入是方舟模型服务的能力升级,支持用户调用模型广场上的模型与精调后的模型进行推理。相比原有模型服务,模型接入支持(1)灵活升级接入模型的版本 (2)支持模型接入的调用监控(即将上线),未来还会支持保障更高并发度、更灵活的推理需求。 | 模型接入 |
Release Note - 20231020
功能模块 | 功能说明 | 帮助文档 |
---|
插件能力 | 新发布头条搜索插件,基于外部输入的必要性判断后,调用头条搜索能力,协助大模型实时获取新闻、法律等互联网资讯。当前插件仅适配于豆包系列模型 | 头条搜索插件 |
Release Note - 20230926
功能模块 | 功能说明 | 帮助文档 |
---|
模型评测 | 优化自动评测,上传本地评测数据集或选择平台预置评测数据集,一键完成模型的评测。新增人工评测,创建标注任务并分配给指定标注人,在线协同标注模型的生成效果。 | 自动评测介绍 、 人工评测介绍 |
数据服务 | 数据集标注,支持基础的文本大模型数据集人工标注功能。 | 数据集标注 |
模型广场 | 模型卡片、体验中心支持多版本的模型展示、体验与使用 | 模型广场介绍 |
模型服务 | 新增Lora推理功能特性,Lora精调后的模型部署为在线服务,不用独占机器资源部署,无需排队,轻量便捷 | 模型服务部署 |
安全与信任 | 为模型提供方与模型使用者开放安全审计日志,在安全容器的基础上进一步加密了用户输入文本信息 | 安全审计日志 |
Release Note - 20230806
功能模块 | 功能说明 | 帮助文档 |
---|
统计管理 | 新发布开通管理页,可更清晰了解目前的商品开通状态、限制、价格与帮助文档等;新发布用量统计页,可清晰查看各子账号在各个模型上的调用量与RPM(每分钟请求数)信息 | 开通管理 、用量统计 |
模型精调 | 创建精调任务页:支持LoRA精调,模型精调更高效省时;支持自定义设置验证集;优化了参数配置的交互样式。精调任务列表页:增加了排队时间预估,训练时间预估提示信息 | 创建模型精调任务 |
模型服务 | 创建在线服务:权限管控升级优化,增加了管理员和可见范围的配置。在线服务详情:在线服务支持服务监控,可更好监控模型服务的工程性能指标 | 查看并管理模型服务 |
模型广场 | 支持了公开模型与私有模型的属性,模型卡片权限管控更自由;支持模型列表的搜索 | 模型广场介绍 |
体验中心 | 全新升级AI对话体验中心的交互与视觉,高级参数设置更便捷直观,多模型之间可拖拽排序 | 模型体验介绍 |
Release Note - 20230628
功能模块 | 功能说明 | 帮助文档 |
---|
模型广场 | 新发布模型广场功能,在模型广场上查看并了解所有模型提供方上架在平台上的大模型 | 模型广场介绍 |
体验中心 | 新发布体验中心功能,可快速体验各模型的实际表现效果,探索其在语言、图像等方面的先进能力 | 模型体验介绍 |
模型精调 | 新发布模型精调功能,支持自定义训练集、超参、版本管理等功能,快速精调并使用专属大模型服务 | 创建模型精调任务 |
模型评测 | 新发布模型评测功能,自动根据预置的评测脚本与数据集,从多个维度评价精调后的模型表现效果 | 模型评测方案介绍 |
模型服务 | 新发布模型服务功能,在火山引擎上可直接调用推理API,接入生产环境,并持续运维与监控 | 精调模型发布在线服务 |
安全与信任 | 支持安全可信的推理与精调服务,保障模型提供方的知识产权安全与模型使用者的业务信息安全 | 火山方舟互信计算架构白皮书 |