算子管理--湖仓一体分析服务 LAS-火山引擎

文档中心

导航

算子管理

最近更新时间：2025.04.22 19:25:23首次发布时间：2025.04.22 19:25:23

服务内置丰富的数据处理算子，涵盖大部分非结构化数据场景，包含文本、图像、视频等共40余个内置算子服务，同时您可以根据自身业务基于 Python 脚本自定义算子服务，满足您更加定制化的数据处理工作流串联需求。
本文为您介绍构建自定义算子并运行工作流的具体操作。

自定义算子

构建自定义算子

Docker 镜像准备

将可执行的 python 代码和环境，打包在镜像；
Dockerfile 可以参考：

说明

请将镜像上传到火山的私有镜像仓库中。

LAS 服务中创建算子

在自定义算子的功能页面，选择对应的镜像，添加启动参数，注册成自定义算子。

支持的作业类型有：python、Spark、Ray，需要根据业务实现逻辑进行具体选择。
启动命令，填写业务工程的启动命令，建议使用绝对路径。启动命令中设置的参数，可以通过下面的参数信息进行配置
参数信息中，输入启动命令中需要的参数信息。

示例，/home/main.py 脚本中有两个参数，一般在linux中启动命令为 python /home/main.py --op_type xx --op_name xx，这时需要在“基本信息”中的“启动命令”中填写python /home/main.py，参数配置文件配置op_type和op_name。

创建后，可以在算子管理中查看到自定义算子：

基于自定义算子创建工作流

创建工作流

在工作流功能模块，通过拖拉拽的方式，将自定义算子移动到画布中，配置需要的资源信息即可。

配置完成运行相关的参数，并点击运行按钮。