模型训练有两种训练模式:批式训练、流式训练;三种追新方式:不追新、批式追新、流式追新;您无需指定训练模式,系统会根据您选择的追新方式及样本生成情况自动进行模型训练及追新。
批式训练:训练一段时间区间内的样本, 指定时间区间内的样本全部生成完毕之后才能发起。批式训练有4个过程:样本准备、计算资源准备、模型训练、模型备份(备份完成会生成checkpoint)。您可在任务详情的抽屉页查看训练进度。
流式训练: 需要接入增量行为实时数据,生成流式样本,样本生成后即时训练;进入流式训练后,模型会一直处于模型训练中。
不追新: 执行批式训练;选择样本的开始时间及结束时间,全部样本批式训练完成后即停止训练。
批式追新: 执行批式训练;选择样本的开始时间,系统会先批式训练已生成的样本,然后基于已接入增量天级行为数据或增量实时行为数据dump的数据,自动批式追新训练。
流式追新: 先执行批式训练,然后自动切换为流式训练;选择样本的开始时间,系统会先批式训练已生成的样本,然后基于已接入增量天级行为数据或增量行为实时数据dump的数据,自动批式追新训练;追上增量行为实时数据后,会自动切换为流式追新训练。