说明
本指南用于客户与火山引擎对隐私计算平台的联合测试,帮助客户快速完成联邦建模的前置工作。
前置条件
- 环境准备:已完成平台部署。
- 准备数据:根据约定的数据格式,准备训练数据和测试数据。
类型 | 数据集名称(推荐) | 数据范围 |
---|
训练数据 | trainData_xx | CSV 格式,包含表头 |
测试数据 | testData_xx | CSV 格式,包含表头 |
字段名 | 类型 | 备注 |
---|
raw_id | string | 必须, sha256 电话号码,求交 ID |
label | int | 必须,1 正例,0 负例 |
添加合作伙伴
- 登录管理员账号。
- 在平台首页,右上角头像导航栏选择【合作伙伴】:
- 进入合作伙伴列表页,点击【添加合作伙伴】:
- 填写火山引擎侧提供的合作伙伴信息,并点击【发送请求】;
- 两侧均正常配置后,预期结果:
创建工作区
- 在平台首页,选择左侧导航栏中的【工作区管理】,点击【创建工作区】:
- 在创建工作区页面,填写火山引擎侧提供的工作区基本信息,邀请合作伙伴,点击【发送请求】,发送工作区建立请求至火山引擎侧:
- 两侧均正常配置后,预期结果:
创建数据集
数据集需要训练数据集和评估数据集,建议按照 8:2 提前完成数据切分。
进入客户与火山引擎侧共同创建的工作区。
创建训练数据
本地训练数据导入
- 左侧导航栏选择数据中心> 原始数据集,进入原始数据集页面,选择【创建数据集】可以创建客户侧本地的训练数据集。
- 完成如下配置即可创建训练数据集:
- 数据集名称:推荐
trainData_xx
作为数据集名称 - 导入方式:
本地导入
- 从本地文件中选择:选择已经准备好的本地 CSV 文件
- 返回至原始数据集列表页,查看并确认已创建的数据集状态为“可用”,点击【发布】将数据集发布至工作区:
训练数据求交/对齐
说明
训练数据导入并发布成功后,为了简化客户侧操作,由火山引擎侧发起求交任务。
求交任务发起后,客户侧可以在左侧导航栏选择数据中心> 结果数据集,进入结果数据集页面查看求交/对齐的结果。
创建评估数据
本地评估数据导入
同【本地训练数据导入】。
评估数据求交
同【训练数据求交/对齐】。
联合模型训练
说明
数据求交/对齐后,为了简化客户侧操作,由火山引擎侧发起模型训练及评估,客户侧仅需适时进行授权即可。
- 登录隐私计算平台,左侧导航栏点击模型中心> 模型训练,在列表页面右上角xx条待处理任务,点击火山引擎侧发送的训练任务。
- 进入配置授权页面,输入算法配置、参数配置、资源配置,点击【确认授权】