1. 概述
DataWind 支持直接对接火山引擎增长分析产品 DataFinder(以下简称 Finder),使用 Finder 采集的行为分析数据直接进行分析,也可以与业务数据关联分析,获得更多分析洞察结论。
前置条件:
- 私有化部署 DataWind,对应 Finder 必须私有化部署,需要提前部署好这两个产品
- SaaS DataWind,对应 Finder 必须为 SaaS,需要提前得到 Finder 账号,并且申请 DataWind 与 Finder 的主账号必须是同一个主账号
- 版本要求:
- 私有化部署:Finder 需 V4.3.0 及以上版本,DataWind 需 V2.50.0 及以上版本
- SaaS:Finder 需要为 SaaS 云原生版本
2. 功能说明
2.1 数据连接步骤
(1)点击进入到某个具体项目下,点击数据准备,在下拉列表找到数据连接,点击新建数据连接。
(2)点击左侧应用数据源,选择「火山引擎增长分析DataFinder」
(3)在数据连接基本信息中下拉选择对应应用,并点击保存
(4)点击一键创建数据集按钮,系统将自动创建数据集
(5)创建成功后的弹框中,点击「点此查看」,即可跳转到对应数据集上查看详情
2.2 在数据连接环节可选择的应用范围
- 私有化部署,项目之间是一一对应关系,一个项目空间下有一个可选择应用
- SaaS 版本,可选择该应用火山主账号下创建的所有应用
2.3 用户权限限制
即谁可以创建 Finder 的数据连接?
- 不区分私有化部署或 SaaS
- 在 Finder 上会授权控制 SQL 自定义查询功能,授权可用该功能的用户,即可在 DataWind 上创建 Finder 数据连接,未授权则不可
2.4 接入表结构说明
- DataWind 可以接入 Finder 的 events 表、users 表、items 表
- 接入 Finder 数据的表结构信息可以在数据集详情中查看
- 可对接字段对应 Finder 来源详见数据格式
- 对应详细的解析说明见字段说明中的 events 表、users 表、items 表
- 在应用 events 表中的 event_params.loc_city_id 字段时,需要注意将该字段做转换后才可使用
- 点击数据集的字段配置来到字段配置详情页,然后点击添加字段
- 在字段表达式框中输入以下表达式,点击保存
dictGetOrDefault('default_user_dictionary', 'target_value', tuple('loc_city_id', ifNull(event_params.loc_city_id, 'null')), 'unknown')
- 后续该 events 表的应用中,涉及要使用城市字段则可直接使用该字段
- events 表中的解析字段
event_params.xxx.yyy 字段、user_profiles.xxx 字段和item_profiles.xxx.yyyy 字段会根据实际上报的情况和定义,解析出多个字段,如下是event_params.xxx.yyy 字段的解析示例
2.5 功能限制
- 数据集抽取方式仅直连
- 数据集不支持关联、union 操作
- 不支持可视化建模能力