3.3.4 SqlSever-Hive--DataLeap私有化V2.1.2-火山引擎

文档中心

导航

3.3.4 SqlSever-Hive

最近更新时间：2022.09.05 11:25:30首次发布时间：2022.09.05 11:25:30

使用场景

将SqlSever数据导入到Hive表中，如将业务系统生产的SqlSever数据同步到Hive表，供离线分析使用。

如果未找到SqlSever数据源信息，请在数据源管理中配置对应的SqlSever数据源

alt

字段映射在选好数据来源和目标后，可通过“自动添加”功能填充，也可手动添加和编辑，“自动添加”通过数据源的表结构获取。字段填充后，按需调左右映射。

数据库直连:

非数据库直连：

适用于数据量较大的表
首次导入数据时，从数据库直接拉取（首次导入的业务时间可在调度设置中调整，首次导入业务时间的实例会拉取db全量数据）
后续执行通过“binlog操作日志+目的表前一分区数据”结合的方式，往目标分区中写入数据，即后续导入对db无影响
非数据库直连新增或修改hive字段后的处理方法：新增或修改hive字段后需要重跑一次全量。重跑全量可以通过修改调度设置-调度属性-首次导入的业务时间，然后将任务上线重跑首次导入的业务时间到今天的实例。
需要注意，如果更新了唯一索引字段，且需要重新全量dump，请至少等1天以后，否则有可能出现数据增多。
增量同步需要先接入CDC任务，详见CDC任务说明