任务类型 | 参数 | 参数说明 | 选填/必填 | 填写示例 |
---|---|---|---|---|
PSI求交 | image | fedlearner镜像地址 | 必填 | artifact.bytedance.com/fedlearner/fedlearner:882310f |
num_partitions | 数据分区的数量 | 必填 | 2 | |
raw_worker_cpu | raw_data 任务的 worker cpu大小 | 选填 | 4000m | |
raw_worker_mem | raw_data 任务的 worker 内存大小 | 必填 | 8Gi | |
batch_size | 原始数据是一批一批的从文件系统中读出来,batch_size为batch的大小 | 必填 | 102400 | |
psi_worker_cpu | psi_data_join 任务的 worker cpu大小 | 必填 | 4000m | |
psi_worker_mem | psi_data_join 任务的 worker 内存大小 | 必填 | 8Gi | |
master_cpu | 任务的 master cpu大小 | 必填 | 2000m | |
master_mem | 任务的 master 内存大小 | 必填 | 4Gi | |
对齐 | driver_cores | spark driver pod 的核数 | 必填 | 1 |
executor_cores | spark executor pod 的核数 | 必填 | 2 | |
executor_mem | spark executor pod 的内存大小 | 必填 | 4g |
如需查看数据集关联任务信息,可进入【任务管理】模块查看任务详情。