You need to enable JavaScript to run this app.
导航
概述
最近更新时间:2023.09.05 10:54:50首次发布时间:2023.09.05 10:54:50

机器学习的用户在平台上进行模型训练的最终目的是,希望通过调整参数,配置或者模型结构等,以得到一个在各种指标上都表现较好的模型。开发模型的用户会设定测评指标,在每一次训练后,观察评估本次训练的成果,并根据模型表现和模型预测结果,进行相应调整。多次训练后,不同的模型数据和表现会被汇总,进行横向对比,并整理成实验报告,以便选择表现较好的模型进行上线。

以下是实验管理模块的一些重点功能介绍:

1 完整记录训练过程

通过log语句记录一次完整的训练过程,以便观察各项指标随训练进程的变化趋势。目前支持scalar,histogram,多媒体(图片,音频,视频)展示,默认以step为横轴也可自定义横轴(如epochs)

2 横向对比训练效果

以实验项目为单位,支持用户对同一模型的多次训练进行对比,以便找到最优超参组合。目前支持记录每次实验的config(参数项)和summary(指标项),以及各项数据伴随step的变化图表。

3 丰富的可视化图表和数据

以实验为单位,支持用户自行对实验中的各项数据进行记录,包括文本,图片,音频和视频。用户可根据需求,将丰富的图表类型按step记录,或者定义为二维表格进行展示。
如图,我们演示了自定义表格的展示效果。

4 开放性记录方式

平台的SDK在使用上和Weights&Biases兼容,对以下最常用的3种记录语句实现了0代码修改的无缝切换:

  • wandb.config — track hyperparameters and metadata

  • wandb.summary - track experiment results and performance metrics

  • wandb.log — log metrics and media over time within your training loop

平台也同步支持Tensorboard的主要指标记录:

  • wandb.init(project="demo-sync-tb", sync_tensorboard=True)

后续,我们还会根据用户的使用场景进行语句拓展,以及更多实验记录工具的兼容。