您可以为自定义训练任务创建 TensorBoard 服务,通过 TensorBoard 的可视化界面更直观地查看模型训练结果分析报告。本文为您介绍如何创建 Tensorboard 服务。
登录火山引擎控制台,打开机器学习平台-自定义任务页面。
点击【创建任务】,进入训练任务创建页面。
在【实验记录与可视化工具】模块,开启 TensorBoard 服务
指定 TensorBoard Logs 的存储位置,平台目前支持 NAS 和 vePFS 两种存储类型。平台将自动
点击提交任务。
若您需要通过命令行创建自定义任务,可以在配置文件中开启并指定 TensorBoard Logs 的存储位置。
# 是否开启 TensorBoard EnableTensorBoard: true # 开启 TensorBoard 后填写,将日志写入到 NAS 或 vePFS 内,需开白 TensorBoardStorage: Type: "Nas/Vepfs" # 必填,TensorBoard 日志写入存储实例类型,可填写 Nas 或 Vepfs NasId: "replace with your NAS Id" # NAS 实例 Id,当 Type 为 Nas 时填写,与 NasAddr 至少选填一个 NasAddr: "replace with your NAS Addr" # NAS 实例挂载点地址,当 Type 为 Nas 时填写,与 NasId 至少选填一个 VepfsId: "replace with your VepfsId" # type为Vepfs时:若在平台挂载了两个Vepfs实例,则需要指定对应VePFS实例ID;只有一个实例时,可以为空 SubPath: "replace with NAS sub path" # 必填,TensorBoard 日志写入的存储实例子目录,当 Type 为 vePFS 时,需要拥有该子目录的挂载权限
待任务成功运行后,可以选择该任务,点击【对比TensorBoard】。平台将会为您创建 TensorBoard 服务,并自动将 TensorBoard Logs 的存储挂载至服务上。
平台目前也支持通过实验管理记录训练数据,实验管理支持了 wandb 的全套能力。更多请查看概述--机器学习平台-火山引擎