DataTester支持对接数仓数据源,以及创建相关数据集,用于直接查询用户数仓中的数据表,作为AB实验过程中使用的实验指标(数仓指标),本文为您介绍对接数据源和数据集相关的注意事项和操作步骤。
使用限制与注意事项
- 版本要求:V 4.6.0以上版本支持数仓指标功能。
- 支持的数据源:当前数仓指标支持的数据源类型包括:Hive、Clickhouse、ByteHouse CE、ByteHouse CDW。
说明
4.9.0版本开始支持Clickhouse、ByteHouse CE、ByteHouse CDW类型的数据源。
- 前提条件:使用数仓指标前,您需要联系技术支持人员,申请在「版本管理」中开启该功能的使用权限。
操作流程
- 准备工作:在数仓中准备好需要在 A/B 实验平台计算的指标表,需要包含user_id 和 date 字段
- 在 A/B 实验平台 「开放能力-数仓集成-数据源」配置数据链接,详情请参见下文的创建数据源章节。
- 在 A/B 实验平台 「开放能力-数仓集成-数据集」配置临时中间表(视图)和**进组表,**详情请参见下文的新建数据集章节。
- 后续步骤:
- 在 A/B 实验平台 「指标管理-指标组列表-数仓指标组」中,配置数仓指标
- 在创建实验时选择已创建的数仓指标
- 在实验报告中查看数仓指标
创建数据源
您需要在DataTester中创建好对应数仓的数据源,指定连接的数仓数据库和连接所需的鉴权、登录等信息,便于后续在使用数仓指标时,直接查询对应数据库中的数仓指标表。
各类数据源的核心配置项的配置指导详情请参见外部数据源。
新建数据集
您需要在数据集页面中创建临时中间表(视图)和**进组表,**A/B 实验平台在计算数仓指标时,通过将进组表与业务数据表同时存储到客户的数仓中,在指标计算时关联查询。
新建数据集的操作详情请参见数仓数据集。
后续步骤:创建数仓指标
详情请参见新建数仓指标。