DataLeap 提供 Shell 任务类型,可支持资源的引用、配置参数以及编辑 Shell 脚本来满足您的业务场景需求。本文将为您介绍 Shell 任务配置说明。
子用户登录创建任务时,若手动选择网络环境,则需具备私有网络相关服务的使用权限。此时,需要主账号应在访问控制中,为子用户添加 VPCReadOnlyAccess 或 VPCFullAccess 权限。详见访问控制。
注意
任务名称信息仅允许字符.、字母、数字、下划线、连字符、[]、【】、()、()以及中文字符,且需要在127个字符以内。
任务创建成功后,进入代码开发编辑界面。
支持语言:Shell Bash,如下所示:
echo "Hello World !"
参数:支持时间参数 ${date}、${hour} 等,更多参数可参考:时间变量与常量说明
echo ${date}
当任务在脚本中访问公网、私有网络(VPC)资源,或者访问有存在网络访问限制的镜像仓库地址时,您需要进行网络配置,选择能够与您资源互通的私有网络、子网、安全组信息。
有以下两种方式:
说明
子用户登录创建任务时,若手动选择网络环境,则需具备私有网络相关服务的使用权限。此时,需要主账号应在访问控制中,为子用户添加 VPCReadOnlyAccess 或 VPCFullAccess 权限。详见访问控制。
产出数据登记用于记录任务的数据血缘,不会对代码逻辑造成影响。如果 Shell 任务中含有对应引擎库表数据的产出时,强烈建议填写,以便后续维护任务数据血缘关系。
单击进入右侧侧边栏执行设置窗口。
选择计算资源组:支持选择公共计算资源组,独享计算资源组。
镜像地址:
支持您自定义镜像,建议使用火山引擎镜像仓库,填写示例如下:
说明
DataLeap 额外提供了以下镜像地址,您可根据实际场景进行使用:
镜像地址 | 说明 |
---|---|
dataleap-cn-beijing.cr.volces.com/studio/datax:v1 | 包含 DataX 工具集的公共镜像地址,您可使用该镜像地址,通过 Shell 任务,使用 DataX 的数据集成同步框架,创建各数据源间的通道任务,最佳实践案例详见:Shell 调用 DataX。 |
dataleap-cn-beijing.cr.volces.com/studio/mysql:0.0.1 | 您可使用该镜像地址,通过 DataLeap 中的 Shell 节点任务,来访问或操作兼容 MySQL 协议的相关数据库表信息,如支持连接 MySQL 数据库表、火山引擎 E-MapReduce(EMR) Doris 数据库表等 |
资源配置:资源可根据实际需求进行配置,以 CU 为单位,默认配置 1CU(1CU = 1Core 4GB),下拉可选择更多规格的资源配置。
说明
其中 0.25CU、0.5CU 规格,仅独享计算资源组支持选择。
资源选择:
Shell 任务支持在任务编辑中使用通用资源,通过访问 Jar、File、Zip 等资源类型,来提升数据开发效率。
在资源选择下拉框中,选取任务中所需使用到的资源,若还未创建资源,您也可单击新建资源按钮,前往资源库进行新建。新建资源操作详见资源库。
单击任务模板按钮,您可以选择是否通过任务模板方式,便捷快速的复用代码模板逻辑,在弹窗中选择使用 Shell 任务模板,并选择相应的版本号,输入替换的参数即可完成复用。
注意
任务编辑完成后,您可按需配置节点的调度相关属性,并进行后续的保存、调试任务及提交发布操作操作。提交发布说明详见:数据开发概述---离线任务提交。
注意
timedatectl set-timezone “Asia/Shanghai”