3.3.10 Hive-Hbase--DataLeap私有化V2.1.2-火山引擎

文档中心

导航

3.3.10 Hive-Hbase

最近更新时间：2022.09.05 11:25:31首次发布时间：2022.09.05 11:25:31

使用场景

将Hive数据导入到Hbase中，供离线分析使用。

如果未找到Hbase数据源信息，请在数据源管理中配置对应的数据源

alt

同步方式：sql同步或数据表同步
数据库：hive所在的数据库
数据表：hive目标表
分区：分区字段从hive表自动获取
1. 天级分区，若日期格式为:yyyyMMdd 如:20181017，则填写：${date}
2. 天级分区，若日期格式为:yyyy-MM-dd 如:2018-11-17，则填写：${DATE}
数据同步：数据同步天数，使用静态分区同步
数据写入方式：区分清除式写入/覆盖式写入

参数	默认值	备注
null_mode	skip	碰到null值的处理方式： 1. skip: 不写入 2. empty: 写入空byte[]
wal_flag	false	是否开启 write-ahead log功能
version_column	按当前时间戳写入	时间戳写入模式： 1. 获取列的值作为时间戳动态写入，Date类型会进行解析,如{"index":1}，取第一列的值作为时间戳 2. 指定时间戳值静态写入，如{"value":12415123}，所有时间戳均写入为12415123 3. 不设置该参数则按当前时间写入
encoding	UTF-8	数据编码格式
write_buffer_size	8MB	写入缓冲区大小,单位为bytes, 8MB: 810241024

字段映射在选好数据来源和目标后，hive信息可自动添加，来源于hive表结构；Hbase需要手动添加，可调整映射顺序。

若下游Hbase开启鉴权，需启用高级设置，设置自定义参数
参数设置：job.reader.hadoop_conf ｜ ipc.client.fallback-to-simple-auth-allowed=true
alt

点击调试按钮，选择业务日期进行调试，调试结果/日志可在页面查看
alt

调度设置等详见通用设置说明