Bytehouse CDW Pipeline 连接器可以用作 Pipeline 的 Data Sink,将数据写入 Bytehouse CDW。 本文档介绍如何设置 Bytehouse CDW Pipeline 连接器。
从 MySQL 读取数据同步到 Bytehouse CDW 的 Pipeline 可以定义如下:
################################################################################ # Description: Sync MySQL all tables to BH CDW ################################################################################ source: type: mysql name: MySQL Source hostname: vedbm-xxx.pri.mysql.vedb.ivolces.com port: 3306 username: your-username password: your-password tables: app_db.\.* server-id: 5401-5420 sink: type: bytehouse-cdw name: Bytehouse CDW Sink region: VOLCANO_PRIVATE host: tenant-xxxx-cn-beijing.bytehouse.ivolces.com port: 19000 virtual-warehouse: test api-token: xxx:xxx sink.buffer-flush.interval: 5s sink.buffer-flush.max-rows: 10000 timestamp-offset: -8h pipeline: name: MySQL to Bytehouse CDW Pipeline parallelism: 16
参数 | 是否必选 | 默认值 | 数据类型 | 描述 |
---|---|---|---|---|
type | required | (none) | String | 指定要使用的连接器, 这里需要设置成 |
name | optional | (none) | String | Sink 的名称. |
region | optional |
| String | 指定 ByteHouse Gateway 的地域。
|
host | required | (none) | String | ByteHouse 网关的私有主机。前提是将 region 设置为 |
port | optional | 19000 | String | ByteHouse 网关的私有端口。前提是将 region 设置为 |
virtual-warehouse | required | (none) | String | 用于指定计算组的名称。 |
api-token | required | (none) | String | 连接器帐户的 API Token。 |
sink.mode | optional | upsert | String | 选择要接收的数据记录。支持的值包括:
|
sink.buffer-flush.interval | optional | 1s | Duration | 刷新时间间隔,最小值为 200 ms。 |
sink.buffer-flush.max-rows | optional | 50000 | Integer | 缓冲记录大小,最小值为 100。 |
sink.max-retries | optional | 15 | Integer | 最大写入重试次数,设置为 -1 表示无限次重试。 |
jdbc.max-retry-backoff | optional | 32s | Duration | 最大指数回退重试间隔,会从 1s 开始指数递增。默认为 32s,表示从 1s、2s、4s ...,一直递增到 32s 后,保持不变。 |
timestamp-offset | optional | (none) | Duration | TIMESTAMP 类型的附加时间偏移。 |
CDC type | Bytehouse CDW type | NOTE |
---|---|---|
TINYINT | TINYINT | |
SMALLINT | SMALLINT | |
INT | INT | |
BIGINT | BIGINT | |
FLOAT | FLOAT | |
DOUBLE | DOUBLE | |
DECIMAL(p, s) | DECIMAL(p, s) | |
BOOLEAN | BOOLEAN | |
DATE | DATE | |
TIME | TIME | Bytehouse CDW Connector 目前不支持 TIME 类型写入,预计下个版本支持。 |
TIMESTAMP | DATETIME | |
TIMESTAMP_LTZ | DATETIME | |
CHAR(n) | STRING | |
VARCHAR(n) | STRING | |
STRING | STRING |