说明
此功能私有化V4.2.2(含)以上版本支持,如需使用需单独联系您的客户成功经理进行开通。
在企业进行数据采集时使用过其他厂商的埋点系统,不希望重复建设埋点体系,希望DataTester能够提供数据集成的方案,对历史数据资产直接复用。为了支持数据集成的需求, DataTester采用可视化数据集成的方式支持Kafka消息订阅,通过创建并执行数据集成任务,将其他厂的UBA数据上报至火山DataTester数据服务。
DataTester提供两种方式进行数据集成,分别为可视化配置和自定义上传配置,两种方式带来的效果一致,二选一即可(但是如果存在函数插件的诉求:V4.4.0版本需要使用自定义配置上传实现)
kafka任务不支持定时重复提交
具体文件格式可以参考自定义配置集成
通过数据集成的同步的用户行为数据,可以在Datatester后台【数据管理】页面进行查看,并可使用该部分事件创建事件指标,示例如下:
仅4.7及以上版本支持失败重启。
神策和kafka数据集成任务创建完成后,默认配置Flink作业的固定延时重启策略,最大可尝试重启10次,两次重启之间延迟时间为300秒,任务成功重启后,任务明细输出数据和失败数据监控会清零
通过下载配置查看env默认配置如下参数
env { execution.restart.attempts = "10" execution.restart.delayBetweenAttempts = "300000" execution.restart.strategy = "fixed-delay" }
自定义数据集成任务可以在配置文件env中手动添加以上失败重启策略,也可自定义参数数值