随着火山方舟平台模型的升级、发布,新版本模型在效果、推理时延等各方面将远超较旧版本的模型。因此,我们将逐步下线这些旧版本模型。当某个模型确定弃用时,在正式下线前,我们会通过短信、站内信等方式发布通知,请及时关注。
模型弃用及下线完整流程如下:
宣布旧版本模型弃用,并注明该模型下线并停止服务的日期
通过短信、站内信、平台公告等多种方式发布通知
自正式通知日(即「通知时间」)起,逐步下调弃用模型的使用额度(即下调RPM和TPM的配额)
至模型下线日期(即「下线时间」)时,模型正式下线并停止服务,已创建的模型推理服务将无法继续调用
注:一般情况下,每个版本的模型会在上线后3-6个月后,正式下线并停止服务。在停止服务前,我们会为开发者预留充足的时间完成新版本模型的效果测试,以便流量切换。
我们会通过短信、站内信、平台公告等多种方式发布模型弃用及下线的通知
我们会确保在模型正式下线前至少30个自然日发布通知
请关注相关通知,以便做好升级模型版本所需的各项工作
模型弃用
不可新创建推理服务接入点:弃用模型不可再新创建推理服务接入点,仅支持切换推理服务接入点指向的模型版本
逐步下调配额:模型弃用后,会逐步下调已创建推理服务接入点使用配额,直到完全下线
模型下线
精调模型:模型下线当日停止服务,无法调用
非精调模型:将自动升级至最新版本
模型切换涉及到不同场景的切换,包括同模型版本切换、不同模型迁移、精调模型服务迁移;以下是针对不同场景的迁移指引
【2024年10月即将上线】平台为相同模型的不同模型版本切换,提供推理服务接入点平滑切换。 在方舟平台的在线推理页面,修改推理服务接入点对应的模型版本(暂不支持精调模型及模型单元的版本切换)。无需修改代码,即可实现模型版本的平滑切换,支持更新模型版本。
操作步骤 | 图示 |
---|---|
| |
| |
| |
说明:
|
如果希望进行例如Doubao-pro-4k迁移至Doubao-pro-32k不同模型之间的迁移,需要用户自行创建新模型的推理接入点并完成相应的代码变更,平台暂不支持平滑迁移。
由于精调模型的依赖基座模型,如果需要变更精调模型对应的基座模型,需要在新的模型版本上再次精调模型,并验证效果达到预期后,再创建新的推理接入点,完成相应的代码变更,实现迁移。
如有其他迁移问题,可以通过提交工单的方式,进行咨询。
通知时间 | 下线时间 | 影响说明 |
---|---|---|
2024年9月30日 | 2024年11月30日 | 模型下线工作将于通知时间起进行,自通知时间开始,将逐步下调弃用模型配额; |
模型名称 | 模型版本 | 替代模型 |
---|---|---|
Doubao-pro-4k | 240515 | Doubao-pro-32k/240828 |
browsing-240524 | Doubao-pro-32k/browsing-240828 | |
character-240515 | Doubao-pro-32k/character-240828 | |
functioncall-240515 | Doubao-pro-32k/functioncall-240815 | |
Doubao-pro-32k | 240515 | Doubao-pro-32k/240828 |
Doubao-pro-128k | 240515 | Doubao-pro-256k/240828 |
Doubao-lite-4k | 240328 | Doubao-lite-32k/240828 |
character-240515 | Doubao-lite-4k/character-240828 | |
Doubao-lite-32k | 240428 | Doubao-lite-32k/240828 |
Skylark3-pro-4k | 240415 | Doubao-pro-32k/240828 |
Skylark3-lite-4k | 240328 | Doubao-lite-32k/240828 |
Skylark3-lite-pretrain-4k | pretrain-240328 | Doubao-lite-32k/pretrain-240615 |
Skylark3-lite-128k | 240428 | Doubao-pro-256k/240828 |
Skylark2-lite-8k | browsing-intent-240415 | Doubao-lite-4k/browsing-intent-240828 |
browsing-intent-240615 | ||
1.0 | Doubao-lite-32k/240828 | |
Skylark2-lite-character-8k | Doubao-lite-4k/character-240828 | |
Skylark2-pro-character-4k | 1.0 | Doubao-pro-32k/character-240828 |
Skylark2-pro-32k | 1.0/1.1 | Doubao-pro-32k/240828 |
Skylark2-pro-4k | browsing | Doubao-pro-32k/browsing-240828 |
browsing-240415 | ||
character-240328 | ||
1.2/1.3 | Doubao-pro-32k/240828 | |
Skylark2-pro-pretrain-4k | Doubao-pro-32k/pretrain-240615 | |
Web-intent | 1.0 | Doubao-lite-4k/browsing-intent-240828 |
Skylark-Web | Doubao-pro-32k/browsing-240828 | |
Skylark-plus-public | Doubao-pro-32k/240828 | |
Skylark-pro-public | Doubao-pro-32k/240828 | |
Skylark-lite-public | Doubao-lite-32k/240828 | |
Skylark-chat | Doubao-pro-32k/character-240828 |