You need to enable JavaScript to run this app.
导航
数据查重工具
最近更新时间:2025.02.27 19:28:48首次发布时间:2025.02.27 19:10:24

DataTester支持数据查重工具,如果实验指标数据可能存在重复上报的情况,您可使用数据查重工具进行查找定位,找到疑似重复的数据,进而对重复数据进行处理,避免指标计算不准确。本文为您介绍数据查重工具的使用详情。

注意事项
  • 当前支持对实验指标事件进行疑似重复数据进行查重,您可以查重结果作为参考进行数据治理和指标处理。
  • 查重任务创建完成后,每日9点会自动运行查重任务,任务运行结束后,会将查重结果消息发送至您配置的飞书Webhook地址中,您可根据消息提示下载查看疑似重复数据。

进入数据查重工具
  1. 登录并进入DataTester控制台后,单击页面左侧导航栏的A/B测试>实验工具箱,在工具箱页面选择数据查重工具
    Image
  2. 进入数据查重工具页面后,您可查看已创建的查重任务,也可创建新的查重任务。
    Image

创建数据查重任务
  1. 单击数据查重工具页面右上角的创建任务,。在弹出的任务页面中配置查重任务参数。
    Image

    参数

    配置说明

    任务名称

    自定义数据查重任务的名称。

    事件名称

    在下拉列表中选择需要查重的指标事件。不支持选择任意事件、任意主动事件这类无查重意义的事件。

    飞书Webhook地址

    配置查重结果消息通知的飞书Webhook地址。

  2. 任务配置完成后,单击创建任务,即可完成查重任务的配置。

运行数据查重任务

数据查重任务创建完成后,DataTester会在每天9点自动开始运行所有已创建的任务,任务运行完成后,会将运行结果发送至飞书群组中。

注意

当前暂不支持暂停、删除已创建的数据查重任务,如果您希望暂停或删除任务,可联系技术支持人员协助处理。

下载疑似重复数据

任务运行结束后,您可在数据查重工具页面单击下载按钮下载疑似重复数据,每次下载最多支持下载10,000条数据。
Image