DolphinScheduler 是一个分布式、可扩展的工作流调度程序平台,以其强大的容错性和易用性而闻名。
在使用之前,请提前准备好以下安装程序和用户账户。
注:出于演示目的,我们将使用独立部署环境。
DOLPHINSCHEDULER_VERSION=3.1.8 docker run --name dolphinscheduler-standalone-server -p 12345:12345 -p 25333:25333 -d apache/dolphinscheduler-standalone-server:"${DOLPHINSCHEDULER_VERSION}"
Username
: adminPassword
: dolphinscheduler123
目前 ByteHouse 上可以运行的任务类型有两种:
通过选择 Python 节点并输入以下内容来创建 Python 工作流程:
示例脚本:
注意:您所在地区的
Host
:Port
字段可以参考支持的地域及可用区 获取;API 密钥 <API_KEY> 请参考 获取 API Token 设置。
from bytehouse_driver import Client client = Client.from_url('bytehouse://{HOST}:{PORT}/?user=bytehouse&password=<API_KEY>') result = client.execute("SELECT * FROM <db>.<table> limit 10;") assert len(result) == 10, "invalid result size"
如果您使用的是 Python 工作流,请在 docker file 中使用提供的映像和附加 Python 设置。
FROM apache/dolphinscheduler-standalone-server:3.1.5 RUN apt-get update RUN apt-get install -y software-properties-common RUN add-apt-repository ppa:deadsnakes/ppa RUN apt-get install -y python3.9 python3-pip RUN mkdir -p /opt/soft RUN ln -s /usr/bin/python3 /opt/soft/python RUN pip install bytehouse-driver CMD ./bin/start.sh
通过选择 HTTP 节点并输入以下内容来创建 HTTP 工作流:
Prop | Type | Value | |||
---|---|---|---|---|---|
Authorization | Headers | Bearer <API_KEY> | |||
x-user-activerole | Headers | SystemAdmin | |||
Content-Type | Headers | application/json | |||
query | Body | SELECT * FROM mode Body clickhouse_sql 使用限制
支持的示例:
不支持的示例:
|