You need to enable JavaScript to run this app.
导航
血缘分析
最近更新时间:2024.06.25 15:50:18首次发布时间:2024.06.24 17:03:16

1.血缘分析概述

1.1 概述

血缘分析是用于追踪和理解数据的来源、流向以及数据在整个系统或流程中演变过程的一种方法,能帮助用户更方便的数据管理。
用户通过血缘分析能够查询仪表盘、图表、数据集、可视化建模、大屏、数据源/数据连接等资源的全链路上下游依赖,清晰地了解数据是如何产生的,经过了哪些处理步骤和转换,最终被哪些资源所使用。在排查问题时,血缘分析也可以帮助用户快速定位问题所在,如向上追溯引入指标计算问题的关键节点,向下评估指标变更导致的口径计算影响面等。血缘分析功能对于保障数据的可靠性、可用性和价值发挥,以及提升企业的数据管理水平和业务决策能力具有至关重要的意义。

1.2 应用场景

  • 掌握数据分析链路:透过资源血缘,可以看到每一个数据源、数据集、可视化建模任务、图表、仪表盘、数字大屏等之间的关联,轻松掌握数据分析的流程。
  • 评估资源删改风险:了解资源上下游依赖情况,可更全面地评估资源删改风险;在排查问题时,也可快速定位问题所在,如向上追溯引入指标计算问题的关键节点,向下评估指标变更导致的口径计算影响面等。

2.功能介绍

2.1 进入血缘分析

(1)点击项目中心。
(2)点击左侧的血缘分析,即可进入血缘分析界面,选择资源类型、对象、分析粒度等,查看资源之间的全链路关系。

2.2 查询资源血缘

如图所示,用户可以依次按照资源类型、资源对象、分析粒度进行查询,查看某资源的全链路血缘分析。
(1)选择资源类型。用户可以查询仪表盘、图表、数据集、可视化建模、大屏、数据源/数据连接类型的资源:

(2)在选择的资源类型下,选择需要查看全链路血缘分析的资源对象。

(3)选择分析粒度。若资源类型为图表、数据集、数据源/数据连接,可选择分析粒度查看不同粒度的血缘分析:

类型

分析粒度

图表

图表

维度/指标

数据集

数据集

维度/指标

数据源/数据连接

数据表/sheet名称

字段

仪表盘

仪表盘

可视化建模

可视化建模

大屏

大屏

以数据集资源类型为例,若选择维度/指标为分析粒度,可在右上角选择字段,对单个字段进行全链路的血缘分析。

2.3 了解血缘详情

(1)选择需要查看血缘的资源后,系统将自动统计该资源关联的资源个数、上下游资源类型与个数,便于客户进行信息概览。

(2)血缘分析视图以列表形式展示与该资源相关的其他资源的具体信息:

  • 资源名称:可点击跳转至资源详情编辑页面
  • 资源类型
  • 上下游:指数据的流动方向和依赖关系。分为上游、基准、下游。当前选择的资源为基准,上游指数据的来源或产生数据的起点,下游则是指那些依赖于上游数据进行进一步处理、转换、存储或使用的环节

上游:数据源、可视化建模、数据集
下游:仪表盘、图表、大屏、可视化建模、数据集

  • 层级:展示层级关系。当前选择的资源为0级
  • 资源ID
  • 路径
  • 所有者

(2)点击【访问统计】,即可跳转到该资源的访问详情:

(3)若选择粒度为字段或维度/指标,则会显示相关资源的字段信息:

(4)若用户想要查询某资源是否与选择的资源有关联时,或血缘关联的资源较多,想要针对单个资源进行查看时,可在右上角搜索栏键入资源ID进行查找。如下图,说明资源ID为354的数据源与当前选择的数据集有血缘关联。

2.4 下载血缘分析

点击右上角下载按钮,可将当前查询的血缘分析结果以xlsx/csv格式下载至本地,方便用户存档和进行进一步分析、展示。

*血缘链路完整性和准确性说明:

  • 数据集:自定义 SQL 类型,仅支持表级别血缘,准确度 90%。
  • 维度/指标:仅能保障表达式中为数据源字段的完整性和准确度。

例如:数据集中有指标A1/A2,添加字段A3=A1+A2,则A3的血缘当前无法识别。