服务内置丰富的数据处理算子,涵盖大部分非结构化数据场景,包含文本、图像、视频等共40余个内置算子服务,同时您可以根据自身业务基于 Python 脚本自定义算子服务,满足您更加定制化的数据处理工作流串联需求。
本文为您介绍构建自定义算子并运行工作流的具体操作。
将可执行的 python 代码和环境,打包在镜像;
Dockerfile 可以参考:
说明
请将镜像上传到火山的私有镜像仓库中。
在自定义算子的功能页面,选择对应的镜像,添加启动参数,注册成自定义算子。
示例,/home/main.py 脚本中有两个参数,一般在linux中启动命令为 python /home/main.py --op_type xx --op_name xx
,这时需要在“基本信息”中的“启动命令”中填写python /home/main.py
,参数配置文件配置op_type
和op_name
。
在工作流功能模块,通过拖拉拽的方式,将自定义算子移动到画布中,配置需要的资源信息即可。
配置完成运行相关的参数,并点击运行按钮。