You need to enable JavaScript to run this app.
导航
可视化数据集成
最近更新时间:2024.11.07 19:16:51首次发布时间:2023.06.09 16:02:39

说明

此功能私有化V4.2.2(含)以上版本支持,如需使用需单独联系您的客户成功经理进行开通。

一、概述

在企业进行数据采集时使用过其他厂商的埋点系统,不希望重复建设埋点体系,希望DataTester能够提供数据集成的方案,对历史数据资产直接复用。为了支持数据集成的需求, DataTester采用可视化数据集成的方式支持Kafka消息订阅,通过创建并执行数据集成任务,将其他厂的UBA数据上报至火山DataTester数据服务。

  • 创建数据集成任务
    • 通过输入Kafka服务器、topic等信息,进行数据源的连接
    • 将连接后的数据源内的元数据进行解析,支持客户通过数据映射配置进行字段映射
    • 支持客户对任务配置时间/周期等进行配置
    • 支持客户对任务设置任务告警
  • 任务运维
    • 在任务列表通过任务开关对任务进行启动/停止
    • 通过任务日志可以查看数据任务的执行结果
    • 任务明细&邮件可以查看单次告警明细

二、数据集成流程示例
  • 流程示例:某厂商Kafka-UBA数据接入DataTester

Image

三、与客户平台交互方式说明

Image

四、功能介绍

4.1 创建集成任务

DataTester提供两种方式进行数据集成,分别为可视化配置和自定义上传配置,两种方式带来的效果一致,二选一即可(但是如果存在函数插件的诉求:V4.4.0版本需要使用自定义配置上传实现)

4.1.1 可视化配置数据集成

Image

1.基本信息

  • 新建数据集成任务,需要定义数据集成任务的基本信息
  • 选择需要同步的数据源类型:UBA数据、用户属性

Image

2.数据源连接

  • 新建数据集成任务时,需输入“提供数据源”的三方/客户的消费者组名称、kafka服务器地址、kafka Topic名称,进行数据源的连接测试
  • 点击连接测试会尝试连接topic并读取最新一条数据填充示例
    Image

3. 元数据映射

  • 数据源字段映射至Tester系统字段
    Image

4.任务配置

  • 支持客户对任务配置时间/周期等进行配置

kafka任务不支持定时重复提交

Image

5.配置监控告警

  • 支持客户添加告警策略设置告警规则,并在触发告警后在邮件可收到提醒或在任务明细查看
    Image

4.1.2自定义配置数据集成

1.自定义配置集成任务

  • 选择自定义配置集成任务
    Image

2.创建集成任务

  • 上传配置
    Image

3.配置文件

具体文件格式可以参考自定义配置集成

4.2 任务运维

4.2.1 任务列表

  • 任务列表
    Image
  • 任务明细
    Image

4.2.2 查看监控告警

  • 告警查看形式(1)可以在任务明细模块查看报警的详情信息
    Image
  • 告警查看形式(2)在创建告警时选择的接收告警邮件,触发到告警后会接收到告警邮件

4.3 数据应用

通过数据集成的同步的用户行为数据,可以在Datatester后台【数据管理】页面进行查看,并可使用该部分事件创建事件指标,示例如下:
Image
Image

4.4 集成任务异常失败重启

仅4.7及以上版本支持失败重启。

神策和kafka数据集成任务创建完成后,默认配置Flink作业的固定延时重启策略,最大可尝试重启10次,两次重启之间延迟时间为300秒,任务成功重启后,任务明细输出数据和失败数据监控会清零
通过下载配置查看env默认配置如下参数

env {
    execution.restart.attempts = "10"
    execution.restart.delayBetweenAttempts = "300000"
    execution.restart.strategy = "fixed-delay"
}

自定义数据集成任务可以在配置文件env中手动添加以上失败重启策略,也可自定义参数数值