You need to enable JavaScript to run this app.
导航
归因报告-维度归因
最近更新时间:2024.12.16 10:20:48首次发布时间:2024.02.22 14:45:20

1. 概述

维度归因是归因报告的一项重要功能,可以通过自动化数据归因模块,帮助用户对指标的变化在各个维度上进行拆解,并给出定量的贡献解释。通过维度归因,用户可以深入了解大盘指标的变化原因,并明确各个维度对指标变化的影响程度。(归因决策为增值模块,需单独付费方可使用,自V2.62.0及以上版本支持。如您需要使用,请联系贵公司的商务人员或客户成功经理咨询购买事宜)。

2. 归因配置

对指标进行异动分析前,请您创建归因报告的「归因配置」,「归因配置」指定了进行分析和生成报告所需的相关参数,在归因配置完成之后,系统会根据配置例行运算,并生成报告和推送。

2.1 创建配置

第一步:进入归因报告模块,在「我创建的」标签页内,点击「新建」按钮。
Image
第二步:在弹出的归因配置抽屉页输入归因配置名称,还可添加归因报告说明。
Image

2.2 选择归因类型

进入归因配置编辑页面后,选择「维度归因」。
Image

2.3 配置核心指标

2.3.1 选择指标

Image
首先,请您完成以下内容:
(1)数据集: 从下拉列表中选择一个数据集。
(2)核心指标: 从下拉列表中选择一个指标。
(3)聚合方式:当选择完指标后,需要制定该指标的聚合方式。如果是已聚合过的指标,例如表达式为sum([新增用户数]),那么此处自动选为“聚合”且不可编辑。
(4)目标:

  • 选项内容:越高越好 或 越低越好
  • 作用层面:报告的显示层面
  • 应用范围:上升下降 Icon 的颜色

以下示例中的指标为越高越好,用绿色表示;则下降代表不好,用红色表示。
Image
其次,在指定好核心指标之后,系统将自动提取出核心指标的表达式,并根据表达式的特性来自动选择贡献率算法。以下是公式和选取算法之间的映射关系:

贡献率算法

公式

定基法

sum(); count(); count(distinct); sum()/sum()
更多请参考定基法

占比加权法

sum()/sum(); sum()/count()
分子分母都可加的除法

剔除法

表达式中使用了LOD函数

  • 定基法和占比加权法的算法原理请前往:维度归因-贡献率算法
  • 当系统检测到核心指标为分子分母可加和的除法公式时,用户除了定基法之外,还可选择占比加权法。

Image
最后,当系统检测到核心指标的公式中缺乏必要的数据集字段时,用户需要根据提示前往可视化查询创建对应的数据集字段、个人字段即可。

2.3.2 指定业务日期

Image
您需要指定以下内容:

  • 业务日期字段: 以哪个日期字段作为核心指标的统计口径 。
  • 计算粒度: 可按日、周、双周、月、双月 聚合。其中周、双周可以自定义开始日和结束日。

2.3.3 指定对比计算日期

Image

日期

说明

备注

基准日

以该日期作为基准值计算指标的变化

观察日

以该日期作为观察值

报告日

在该日期运行归因报告

当按天运行时,该选项为T表示为今天

  • 天粒度:昨天对比前天的变化值进行归因。那么基准日为T-2,观察日为T-1,报告日为T。
  • 周粒度:上周对比上上周的变化值进行归因,在每周一计算运行归因报告。那么基准日为W-2,观察日为W-1,报告日为周一。

2.3.4 筛选条件(选填)

Image
每个归因配置都必须指定分区日期(p_date)的范围。

  • 全量表的特征: 在可视化查询页面里p_date选最近有数一天且不用改动。
  • 增量表的特征: 在可视化查询页面里p_date通常需要选最近XX天等范围,随着观测日期范围的变化而变化。

Image
左下角的添加按钮表示添加一个 AND 条件。右上角的 OR 按钮 表示在当前条件后添加一个 OR 条件。
每组or条件之外是用and条件连接。例如:(省份=河北 or 地区=华南)and (性别=男) 。

2.3.5 创建网页

在「新增归因」中,您可以直接输入以http://或https://开头的链接地址即可创建网页。

若需对网页执行重命名、复制及删除操作,请点击“更多”,将为您展开相关内容。

2.4 配置维度归因

2.4.1 维度归因视角

您需要指定维度归因的视角,可以选择三种不同维度的形式:
(1)下钻: 每个视角下的维度依次下钻关系。子层级的维度会对父层级维度下的指标变化做贡献解释。
(2)组合: 每个视角下的维度为叉乘关系。维度组合后对大盘指标变化做贡献解释。
(3)自动发现: 适用于分析思路不明确,频繁变化的情况。
在下图中,系统会自动将数据集中除日期类型字段之外的其他维度字段全部默认选为分析字段,来保证可以在最大范围内寻找根因。如果用户明确某些字段不参与到分析中,可以点击选中后使用穿梭框功能来排除该维度。
Image
举例:
(1)下图显示了1个下钻关系的维度归因视角,为:地区>细分。
默认情况下显示的是地区下各项对大盘指标变化的贡献率。
Image
点击每个项左侧的+,将除法下钻到细分维度。
显示的是某地区下的所有细分维度项对该地区变化的贡献。
Image
(2)下图显示了1个组合关系的维度归因视角,为:app_id-app_id2。
显示的是app_id和app_id2两个维度交叉之后的组合维度项对大盘变化的贡献。
Image
(3)下图显示了自动发现的维度归因视角,从7个维度中发现了5个维度可能是根因维度,并按照重要程度依次显示维度下的各维度项贡献率。
Image

2.4.2 分组维度(选填)

分组维度的作用类似于仪表盘中的公共筛选器。在归因报告中放在顶部,以平铺的形式显示。
Image
下图中的报告头部显示了app_id分组后的效果。All表示不分组,即大盘指标。
选择“188000”后,表示的是 app_id=188000时核心指标的值,以及归因的结果。
Image
注意: 分组维度支持添加多个,但是多个分组维度之间是 or 的关系,并不是 and 关系,所以建议只添加1个分组维度。

2.5 核心指标异动

用户可以通过在维度归因报告中查看核心指标是否异动,来增加辅助业务决策的信息。
勾选“显示”后,需要继续指定异动检测方法,可选算法或自定义规则,功能和异动分析报告配置十分类似。
Image
对应在归因报告和推送卡片的头部将显示核心指标异动的结果:

  • 推送卡片

Image

  • 归因报告

Image

2.6 保存

  • 归因配置在保存后,会自动触发一次试运算。试运算用于对配置和数据进行正确性校验。
  • 为了节省运算时间,每个维度归因视角只会显示2条。因此试运算结果不能作为正式报告进行参考。
  • 对于新建的配置,在保存后还会自动为用户创建一个订阅消息。

Image

  • 用户可在在计算失败时,在归因配置页面设置报告重跑。用户可选择重跑后是否要自动触发订阅;重跑成功后,操作重跑的用户将收到提醒,提醒消息支持跳转查看重跑报告。

3. 查看报告

Image

  • 每次进入归因报告,将会进入到最新的报告页。
  • 报告顶部将显示报告摘要总结,列出引起大盘变化的主要原因 和 反向贡献Top维度项。
  • 对于定基法的报告,使用了相对熵 +维度项占比变化+维度项贡献率来提炼根因。
  • 对于其他算法的报告,使用了维度项贡献率的绝对值来提炼根因。

3.1 报告顶部导航

日期时间是观察日期,可通过切换日期时间,更改观察日。
首先,Hover到报告标题,将显示报告日。
下图说明:在7月4日,计算了 7月3日 vs 7月2日的满意度变动情况。
Image
其次,可点击右侧的查看归因配置 Button,查看具体的归因配置内容。
Image
最后,编辑者可保存报告页,保存后的报告页保留720天,不保存的情况下保留60天。
Image

3.2 对变化的影响

报告页面中默认显示“对变化的影响”,表示下列维度对大盘指标相比于基准期变化值的贡献解释。
Image

3.2.1 大事件

在进行决策分析时往往需要结合内外部因素一起来对数据的波动进行分析解读。其中 ,

  • 内部因素直接来自于已有数据集,用户可直接使用字段进行分析 。
  • 外部因素往往是一些公共事件/热点等,目前没有直接体现在数据集中。

因此,归因报告的大事件模块可以帮助快速获悉外部信息,帮助提升可解释性,使分析视角更加全面。
Image
目前大事件包含以下几类:
(1)中国法定节假日:例如 国庆节、五一劳动节
(2)中国传统节日:例如 七夕节、重阳节
(3)二十四节气:例如 立春、清明
(4)西方传统节日:例如 情人节、圣诞节

3.2.2 根因维度定位(可选)

当归因配置中,维度归因选择了“自动发现”模式时,归因报告中会包含该模块。
系统将用户在配置时圈选的分析维度,使用 相对熵 并对结果经过分层后,定义出了根因维度。
Image
点击展开图表后,将显示出所有参与分析的维度的 Surprise 值分布,其中高亮的维度为最终判定的根因维度。
Image

3.2.3 维度归因视角

每个维度归因视角下包含以下功能:
Image
(1)表格和图表切换
默认为表格视图,点击后将切换成图表视图。将用瀑布图或拆解树来显示。
Image

  • 对于多层级下钻的维度视角,将使用指标拆解树来显示。默认情况下会显示第一层级里同向贡献最大的Top2维度项,从第二层级开始会显示同向贡献最大的Top1维度项。
  • 对于单层级下钻或组合关系的维度视角,将使用瀑布图来显示。瀑布图中X轴从左到右依次为:同向贡献因子Top1,Top2···->反向贡献因子Top10,···,Top1,大盘变化值。

Image
(2)TopN筛选
为了保证加载速度,默认取贡献率绝对值的Top10维度项显示。用户可更改或清空,即不进行TopN筛选。
Image
(3)高级模式
默认情况下表格中显示基本信息,包括:

  • 基准日指标
  • 观察日指标
  • 对比差值
  • 对比百分比
  • 贡献率
  • 贡献值

打开高级模式后,将根据不同算法显示更多中间指标。

算法

高级模式下显示的指标

定基法

分子和分母自身的变化情况;EP值

剔除法

剔除当前维度项后的父层级指标的变化情况;分子和分母自身的变化情况;剔除法得分

占比加权法

分子和分母自身的变化情况;种类内和种类间的贡献情况

EP 值:某维度下某因素波动占总体波动的比率----Explanatory power。详细说明
剔除法得分:剔除维度项后大盘的变化值-大盘变化值。得分越高说明对大盘影响越大。相对熵
种类内和种类间贡献:种类内表示该维度项分子对大盘变化的贡献;种类间表示该维度项分母对大盘变化的贡献。相对熵

(4)下载

  • TopN默认不勾选时,将下载全部维度项数据。
  • 所有层级默认勾选时,将下载所有层级的数据,不勾选时只下载当前表格内展示层级的数据。

Image

3.3 对核心指标的影响

3.3.1 加法指标

展示配置中每个维度的值和占比。占比=每个维度项的数值/核心指标值。占比越高对核心指标的影响越大。
Image

3.3.2 除法指标

采用剔除法来计算影响。剔除维度项对应值之后的核心指标值与原核心指标值的差值越大,该维度项的影响就越大。 举例:
下图中是计算的 2月15日这一天,类别对利润率的影响。剔除家具和技术后,利润率分别下跌2.32%和1.10%比原来低,说明家具和技术是表现较好的类别,没有它们利润率会变差。剔除办公用品后,利润率上涨了14.37%比原来高,说明办公用品是表现较差的类别,没有它利润率还能更好。
计算逻辑:父层级的利润是1291,销售额是19802,利润率是6.52%
第一行数据,剔除家具后利润率 =(1291-607)/(19802-3521)=4.20%
剔除家具后利润率的变动=6.52%-4.20%=2.32%
Image

3.4 归因报告个性化设置

(1)修改趋势图的轴范围
可以调整Y轴范围,Y轴自动(包含0),或者自动(不包含0)。
Image
(2)贡献率报告可以调整默认算法,默认算法将放在第一位。
Image

3.5 自定义对比时间

根据该份报告的归因配置(核心指标、维度下钻路径、筛选条件等),自定义两个时间段的运算。
步骤一:选择归因分析报告页面
Image
步骤二:点击自定义对比时间
Image
步骤三:提交运算,在提交者页面将出现运算状态。
步骤四:运算成功后,打开报告日期选择器。在自定义Tab下,将出现自定义运算的报告。

  • 自定义报告是公共的,有该报告权限用户都可阅读。
  • 自定义报告如果没有保存,生命周期只有7天。

Image

3.6 对大盘的影响

对大盘的影响表示各维度对大盘指标当期值的影响程度。
默认情况下表格中显示基本信息,包括:
(1)核心指标
(2)与大盘指标的差值
(3)剔除该维度项后大盘指标的值 与 当前大盘指标的差值
注意: 剔除该维度项后大盘指标的值与当前大盘指标的差值越大,说明该维度项对当前大盘指标影响越大。
点击图表切换按钮将从表格视图切换至散点图视图。
Image
散点图共分4个象限:左上角的象限表示该维度项自身低于大盘&拉低了大盘;右下角的象限表示该维度项自身高于大盘&拉高了大盘。(这表明右下角象限内的维度项是表现好的维度项,左上角的维度项是表现差的维度项)
Image

  1. 算法说明

贡献率算法:贡献率算法
根因定位算法:根因定位算法