血缘分析是用于追踪和理解数据的来源、流向以及数据在整个系统或流程中演变过程的一种方法,能帮助用户更方便的数据管理。
用户通过血缘分析能够查询仪表盘、图表、数据集、可视化建模、大屏、数据源/数据连接等资源的全链路上下游依赖,清晰地了解数据是如何产生的,经过了哪些处理步骤和转换,最终被哪些资源所使用。在排查问题时,血缘分析也可以帮助用户快速定位问题所在,如向上追溯引入指标计算问题的关键节点,向下评估指标变更导致的口径计算影响面等。血缘分析功能对于保障数据的可靠性、可用性和价值发挥,以及提升企业的数据管理水平和业务决策能力具有至关重要的意义。
(1)点击项目中心。
(2)点击左侧的血缘分析,即可进入血缘分析界面,选择资源类型、对象、分析粒度等,查看资源之间的全链路关系。
如图所示,用户可以依次按照资源类型、资源对象、分析粒度进行查询,查看某资源的全链路血缘分析。
(1)选择资源类型。用户可以查询仪表盘、图表、数据集、可视化建模、大屏、数据源/数据连接类型的资源:
(2)在选择的资源类型下,选择需要查看全链路血缘分析的资源对象。
(3)选择分析粒度。若资源类型为图表、数据集、数据源/数据连接,可选择分析粒度查看不同粒度的血缘分析:
类型 | 分析粒度 |
---|---|
图表 | 图表 |
维度/指标 | |
数据集 | 数据集 |
维度/指标 | |
数据源/数据连接 | 数据表/sheet名称 |
字段 | |
仪表盘 | 仪表盘 |
可视化建模 | 可视化建模 |
大屏 | 大屏 |
以数据集资源类型为例,若选择维度/指标为分析粒度,可在右上角选择字段,对单个字段进行全链路的血缘分析。
(1)选择需要查看血缘的资源后,系统将自动统计该资源关联的资源个数、上下游资源类型与个数,便于客户进行信息概览。
(2)血缘分析视图以列表形式展示与该资源相关的其他资源的具体信息:
上游:数据源、可视化建模、数据集
下游:仪表盘、图表、大屏、可视化建模、数据集
(2)点击【访问统计】,即可跳转到该资源的访问详情:
(3)若选择粒度为字段或维度/指标,则会显示相关资源的字段信息:
(4)若用户想要查询某资源是否与选择的资源有关联时,或血缘关联的资源较多,想要针对单个资源进行查看时,可在右上角搜索栏键入资源ID进行查找。如下图,说明资源ID为354的数据源与当前选择的数据集有血缘关联。
点击右上角下载按钮,可将当前查询的血缘分析结果以xlsx/csv格式下载至本地,方便用户存档和进行进一步分析、展示。
*血缘链路完整性和准确性说明:
例如:数据集中有指标A1/A2,添加字段A3=A1+A2,则A3的血缘当前无法识别。