You need to enable JavaScript to run this app.
导航
智能归因
最近更新时间:2024.10.14 11:01:51首次发布时间:2021.02.23 10:42:03

1. 概述

智能归因,是指可视化看板中内置归因算法,帮助用户洞察业务异常的归因分析功能。能够通过多维度归因分析,透析数据结果,挖掘指标的影响因子与根源,实现智能归因洞察。
*智能归因仅限抽取数据集使用

2. 快速入门

温馨提示:归因分析的触发条件如下

  • X轴为日期类型的字段目前支持的聚合粒度为日、周、月
  • 图中至少有一个指标满足表达式要求,详见后文归因分析支持的表达式
  • 当前分析点 / 对比时间点不为空/null/0
  • 归因分析所用数据集必须是抽取数据集,暂不支持直连数据集

注:归因分析需要一定连续的数据才可以进行归因分析,否则波动状态无法判断

  • 天级:至少需要有14天的连续数据
  • 周级:至少需要有8周的连续数据
  • 月级:至少需要有24个月的连续数据

第一步 :在折线图中,发现最近一天的GMV突然下降,点击下降的数据点,进行归因分析(此处选择「默认归因分析」)
Image
第二步 :归因分析计算完成,点击查看归因结果
Image
第三步 :查看归因结果,最近一段时间GMV波动异常,默认和前一月的数据进行比较,数据下降了22.61%,按照引起下降的贡献对维度进行排名,发现sale_city的系数为0.56,是重要的影响因素,就可以针对这个区域的销售情况进行筛选并经一步分析。
Image

3. 使用场景

随着时间的变化,你通常会看到值大幅上升或急剧下降的情况,并且想知道导致这种波动的原因。借助智能归因,只需单击几下即可了解原因。具体的业务场景举例如下,具体应用效果需结合您的业务数据而定。

3.1 平均延时突增问题归因

Image
问题归因,可以发现可能是Rexxx项目引起的延时增高
Image

3.2 付费金额突增问题归因

Image
归因,发现主要是北京地区增长导致的突增
Image

4. 功能介绍

4.1 归因分析对比时间选择

  • 默认归因分析
    • 天级:默认选择7天前的日期与当前日期对比
    • 周级:默认选择前一周与当前一周对比
    • 月级:默认选择前一个月与当前月对比
  • 自定义对比时间:可以自定义选择对比时间

Image
Image

4.2 解读归因分析报告

Image
A:波动状态,结合最近一段时间的数据,判断该指标波动是否正常
B:指标变化,相比一定时间前,指标的变化的情况
C:维度贡献排名,单个维度:

  • 维度名称
  • 基尼系数,用来表示对指标变化的影响程度
  • 大盘贡献度TOP3维度项
  • 在与CDP一起使用的情况下,此处还有新建群体的能力

D:维度的具体维度项分析

4.3 归因分析配置

支持进行数据集级的归因分析配置。当该数据集进行归因分析时,将依据配置中的归因依据、显示维度进行归因,并展示设定的结果数。

4.3.1 入口

入口一 可视化查询:点击左侧数据集信息的右上角 ⋮ ,选择「归因分析配置」
Image
入口二 数据集:打开所查询的数据集,在右上角选择「归因分析配置」
Image

4.3.2 全局配置与个性配置

归因分析配置中可以对归因依据、显示维度、展示结果数进行预设。
一个数据集中往往有多个指标,当不同指标具有不同的归因配置需求时,可点击“个性配置”,选择指标作特殊配置。而全局配置则生效于“个性配置”指标之外的指标。
如果不进行个性配置,全局配置会生效于所有指标。

4.3.3 异常判断依据

  • 时序预测:基于系统预测自动判断,判断依据为是否符合默认时序预测的预测结果范围
  • 波动大于:根据同环比波动判断,当波动幅度超过指定值时判断为异常

4.3.4 归因维度限制

启用归因维度限制后,将不会对所有的维度进行归因分析,避免计算进无意义的分析维度造成误解、增加运算量。

  • 维度项少于1000个才参与归因:个数可以自由设定。数据集中存在一些id、设备号等具有大量维度项,且无归因意义的维度时,可以勾选此项。
  • 排除部分维度:手动排除部分维度,使之不参与归因。

4.3.5 结果展示限制

归因分析报告默认根据影响的基尼系数,从大到小展示对所有维度的分析结果。勾选此项后,可限制展示维度数。勾选后,可能存在影响维度展示不全的情况。

4.4 支持的表达式

(1)归因分析支持的表达式

表达式

count(distinct XXX)

count(distinct user_id)

sum(XXX)

sum(col), sum(col/100), sum(1/col), sum(case when result = 'failed' then 1/result_count else 0 end)

avg(XXX)

avg(col)

sum(XXX)/sum(XXX)

sum(col1) / sum(col2), sum(case when result='failed' then 1 / result_count else 0 end) / sum(1 / result_count)

sum(XXX)/count(XXX)

sum(vv)/count(uid)

count(XXX)

count(col1)

sum(XXX)/100

sum(col)/100,

100/sum(XXX)

100/sum(col)

XXX/XXX

col/1, col1/col2

XXX

col

(2)归因分析不支持的表达式

表达式

count(distinct XXX) / count(distinct XXX)

count(distinct pid) / count(distinct uid)

uniq(XXX) / uniq(XXX)

sum(XXX) / count(distinct XXX)

sum(vv) / count(distinct uid)

sum(XXX) / sum(XXX) / sum(XXX)

sum(XXX) / sum(XXX) / 1

XXX - YYY

profit - cost

(3)后续将支持

表达式

uniq(XXX)

uniq(XXX)

uniq(XXX)/100

uniq(XXX)/100

4.5 归因的维度范围

在归因分析报告列表左侧的维度列表中,如下几种维度不会出现:

  • 某个维度表达式为id或者date;
  • 某个维度的Top1维度项贡献值太小,不会显示:比如有个维度“省份”,然后上海这个维度项的贡献值最大,但是贡献百分比却 < 1%,会不显示;
  • 某个维度只有一个维度项不会显示;
  • 分区字段维度不会显示;
  • 维度下没有维度项也不会显示;
  • 在时间段分析中,若是一个维度的维度项个数过大(>10K),不会显示;
  • 当维度的数量过多的话(>15或者更多),只会取用户选取的部分维度进行加入计算(选取基尼系数高的 ,并且是当前用户最常用的维度)。

4.6 其他说明

智能归因可适配 StarRocks 数据源。