You need to enable JavaScript to run this app.
导航
最佳实践:集成数仓数据
最近更新时间:2024.09.23 16:45:52首次发布时间:2024.09.23 16:45:52

DataTester支持对接数仓数据源,以及创建相关数据集,用于直接查询用户数仓中的数据表,作为AB实验过程中使用的实验指标(数仓指标),本文为您介绍对接数据源和数据集相关的注意事项和操作步骤。

使用限制与注意事项
  • 版本要求:V 4.6.0以上版本支持数仓指标功能。
  • 支持的数据源:当前数仓指标支持的数据源类型包括:Hive、Clickhouse、ByteHouse CE、ByteHouse CDW。

    说明

    4.9.0版本开始支持Clickhouse、ByteHouse CE、ByteHouse CDW类型的数据源。

  • 前提条件:使用数仓指标前,您需要联系技术支持人员,申请在「版本管理」中开启该功能的使用权限。

操作流程
  1. 准备工作:在数仓中准备好需要在 A/B 实验平台计算的指标表,需要包含user_id 和 date 字段
  2. 在 A/B 实验平台 「开放能力-数仓集成-数据源」配置数据链接,详情请参见下文的创建数据源章节。
  3. 在 A/B 实验平台 「开放能力-数仓集成-数据集」配置临时中间表(视图)和**进组表,**详情请参见下文的新建数据集章节。
  4. 后续步骤:
    1. 在 A/B 实验平台 「指标管理-指标组列表-数仓指标组」中,配置数仓指标
    2. 在创建实验时选择已创建的数仓指标
    3. 在实验报告中查看数仓指标

创建数据源

您需要在DataTester中创建好对应数仓的数据源,指定连接的数仓数据库和连接所需的鉴权、登录等信息,便于后续在使用数仓指标时,直接查询对应数据库中的数仓指标表。
图片

各类数据源的核心配置项的配置指导详情请参见外部数据源

新建数据集

您需要在数据集页面中创建临时中间表(视图)和**进组表,**A/B 实验平台在计算数仓指标时,通过将进组表与业务数据表同时存储到客户的数仓中,在指标计算时关联查询。
新建数据集的操作详情请参见数仓数据集

后续步骤:创建数仓指标

详情请参见新建数仓指标