事件分析作为数据分析最重要的分析方法之一,能够帮助我们研究某行为事件的发生对企业所产生的价值影响。火山引擎增长分析「事件分析」支持通过构建指标、分组筛选及多种可视化图表对用户行为进行多维分析,同时在数据智能洞察方面提供了异常数据分析的功能,可以帮助我们发现更多数据异常带来的影响。
进行事件分析前,您需要了解事件分析工具涉及的主要概念,帮助您了解事件分析工具的分析逻辑,简介如下,详细的事件分析工具涉及的数据模型相关概念的介绍请参见数据模型。
术语 | 概念介绍 |
---|---|
事件(Event) | 事件即用户行为的数据化描述。例如,在某视频APP中,用户观看了内容A后对博主推荐的商品产生了兴趣,随后点击了评论区中商品链接,在电商中完成了购买。观看视频、点击链接、下单购买等一系列用户行为,在通过埋点数据化后即可通过“事件”来描述。 |
属性(Params) | 在火山引擎增长分析平台中,我们通过“事件名称+属性列表”组合的方式来详细准确的描述用户行为:
注意 在增长分析平台中,属性目前支持字符串(string)和数值(int)两种取值类型。
根据应用范围,属性又分为“事件属性”和“公共属性”两类。 |
事件属性 | 与单个或几个事件相关的属性,用以对这些事件进行展开描述,如video_play事件的video_id、video_name、play_mode属性,或video_add_favorite事件的video_id属性。 |
公共属性 | 包括用户属性和场景属性,可以为所有事件所共用。用户属性如用户的年龄、性别,场景属性如app版本、ip地址等。 |
指标 | 数据分析的指标与分析的业务目标相关,通常可通过量化的事件数值来体现待分析的业务指标**。DataFinder中可通过**选择事件、事件/属性数值的计算方式来定义事件分析的指标,并支持通过属性的过滤条件进行过滤分析。 |
事件分析是研究用户行为的常用手段,典型的使用场景包括(但不限于):
火山引擎增长分析提供的事件分析功能非常灵活,可以很好的满足各类场景下的统计需求。
增长分析平台的事件分析,支持以下指标的统计分析:
指标算子 | 含义 | 举例 |
---|---|---|
总次数(PV) | 统计事件的发生次数 | 统计用户在app内播放视频的总次数 |
总人数(UV) | 统计事件的发生人数 | 统计在app内播放过视频的去重用户总数 |
渗透率(UV/AU) | 事件触发总人数/全部活跃人数,其中分母为any_active_event事件的触发人数 说明 any_active_event为系统预置事件,详情请参见跨端预置属性。 | 查看新功能上线后活跃用户的使用占比情况 |
人均次数(PV/UV) | 即 pv/uv,事件的人均发生次数 | 统计用户播放视频的人均次数:pv/uv |
全活跃用户人均次数(PV/AU) | 事件触发总次数/全部活跃人数,其中分母为any_active_event事件的触发人数 | 查看新功能上线后活跃用户的人均使用次数情况 |
按…求和(SUM) | 按事件的数值型属性求和 | 统计视频播放的总时长:sum(video_play_duration) |
按...求最大值(MAX) | 某属性的值的最大值,只支持数值型属性 | 看视频播放时长的最大值 |
按...求最小值(MIN) | 某属性的值的最小值,只支持数值型属性 | 看视频播放时长的最小值 |
按…求平均值 | 某属性的值之和/事件发生次数,只支持数值型属性 | 统计视频播放的平均时长:sum(video_play_time)/pv |
按…求人均值 | 某属性的值之和/事件发生人数,只支持数值型属性 | 统计视频播放的人均时长:sum(video_play_time)/uv |
按...求全活跃用户人均值 | 某数值型属性的值之和/全部活跃人数,其中分母为any_active_event事件的触发人数 | 统计活跃用户的视频播放的人均时长:sum(video_play_time)/全部活跃人数 |
按…求分位数 | 即把单位时间范围内的数据按从小到大排序后,求处在某一分位上的数; | 查看每日用户发生目标事件(此处为看视频)的次数分布情况 |
按…求去重数 | 即对事件参数进行去重统计 | 统计播放视频事件中播放过的视频数 |
按…和用户去重 | 即对事件参数和做过该事件的用户进行去重统计 | 统计用户看过的视频个数总和 |
注意
数值型属性目前特指int/float两种类型。
使用事件分析工具前,您可以先浏览事件分析工具界面,了解主要功能模块,事件分析功能界面由以下部分组成。
界面示例 | 页面模块简介 |
---|---|
| |
其他通用配置 |
|
事件分析工具的使用流程和各个模块的详细使用指导可查看下文详细介绍。
登录并进入DataFinder控制台后,在顶部选择选择分析工具>高级分析>事件分析,进入事件分析工具页面,然后选择要分析的目标事件和统计指标,操作步骤如下。
说明
选择过滤条件的时间属性值时,当前界面下拉框中最多支持展示1000个属性值,如果您的属性值超过1000个且需要使用的属性值不在下拉框中被展示出来,您可以通过搜索的方式查找并选择对应的属性值。
注意
事件指标+自定义指标最多添加50组。
说明
不支持指标嵌套,即已保存的指标再次出现在另一个保存的指标中。如保存的自定义指标未在下拉的指标列表出现,请在指标管理页面检查是否存在不关联的指标嵌套。
细分筛选主要是用来进行用户的过滤筛选,确定需要分析的是符合哪些条件的用户。例如,筛选「城市是东营、商丘,用户分群为测试」的用户进行对应指标的分析。
查看分析结果的可视化图表,并根据需求进行调整。
默认情况下,系统会自动以折线图的方式展示过去7天的统计结果。
您可以根据需求对分析图表进行以下调整:
设定分析的时间粒度:5分钟级、小时级、天级、周级、月级;
可通过日历组件进行快捷设定分析时间段和自定义时间段;
快捷设定时间说明
粒度 | 快捷设定分析时间段 | 过去N.. | 最新(今天、本周周、本月等) | 次新(昨天、上周、上月等) |
---|---|---|---|---|
5分钟 | 今天, 昨天 | 天 | 今天 | 昨天 |
小时 | 今天, 昨天, 本周, 上周 | 天 | 今天 | 昨天 |
天 | 今天, 昨天, 本周, 上周, 本月, 上月 | 天 | 今天 | 昨天 |
周 | 本周, 上周, 本月, 上月 | 天 | 今天 | 昨天 |
月 | 本月, 上月 | 天 | 今天 | 昨天 |
自定义设定时间说明:具体时间至昨天、今天、n天前;n天前至昨天、今天、n天前。
可进行时间的对比的选择:上一周期、上同周期、去年同期、自定义时间;
日期 | 含义 |
---|---|
上一周期 | 首尾相接的上一段时间 |
上周同期 | 向前平移一周,每周顺序对应。 |
上月同期 | 向前平移一月,每月顺序对应,考虑到每个月天数不一致,无法直接平移一个月,因此不支持该选项。 |
去年同期 | 向前平移一年,相应月份和日期对应,具体策略为:直接改变年份,然后用对比时间的结束时间减去被对比时间的时间区间,得到对比时间的开始时间即可。 |
选择可视化图表类型:折线图、堆叠面积图、柱形图、双轴图;
对分析时间段进行缩放,以查看更细或更完整的数据图表;
当图表为“天级 折线图”时,点击线图上的点,就会显示显微镜功能(新建日期批注、存为用户分群、导出用户);
当事件分析组自定义指标,且图表为“天级 折线图”时,显微镜功能只支持“新建日期批注”。(更详细的显微镜功能,可参见显微镜功能)
当事件分析多指标或多分组值时,支持配置双轴展示;
可修改图例“A1 页面访问(总次数)”的名称,且保存图表为看板后,名称可同步到看板。
柱形图-指标说明:
说明
如果您希望查看对照组和日期对比的柱状图,请使用“堆叠图”图表样式查看。
展示统计结果的详细数据表。
详细数据表支持以下操作:
将需要长期监测的指标图表添加到看板中。
点击右上角的「保存到看板」,对要保存的看板进行操作:
例如筛选最近7天(不含今天)的新用户数时,配置示例如下:
您可以使用DataFinder的预置属性:是否首日访问(推荐)、是否新用户、激活时间(SaaS-云原生、私有化)/注册时间(SaaS-非云原生)来过滤指标事件。
说明
更多关于是否首日访问($is_first_day)、新老用户(user_is_new)的介绍请参见逻辑说明。
能看到不同版本下的数据情况,会以从高到低排序展示。与此同时还能看到上报的格式是怎么样的,展示原始上报的属性值字段。下图就是「系统版本=X.X.X」。
在进行趋势分析时,数据的异常波动对于我们发现业务上的问题或机会有重要的提示作用。我们常常会基于经验判断波动是否正常,但常常会忽略一些看似正常,但并不符合波动规律的数据。通过异常诊断我们可以快速发现这些异常数据并展开常用的维度,可以很好的帮助业务人员定位数据波动的原因。
4.2.1 功能激活
当事件分析中事件和对照组的乘积不超过10(如2个事件*对照组5个=10个 可用,事件3个&对照组4个=12个 不可用)并且图表类型是折线图时,会激活“异常诊断”功能。
图表类型 | 事件数量(含自定义指标) * 对照组数量 | 事件属性 + 公共属性分组 |
---|---|---|
折线图 | <= 10 | 无 |
如下图:
4.2.2 图表区说明
异常诊断功能激活后,系统会取回溯天数内的数据进行计算,预测拟合出当前查询时间范围内的数据并以虚线显示在图中。虚线背后颜色较浅的色带表示符合预期的数据范围,色带的宽度由“置信区间”来决定。置信区间数值越大,表示宽容度越高,则更多的实线上的实际数据就会出现在色带范围中,而那些没有出现在色带范围内的实线上的数据点,则会被标记为“异常”点,以红色高亮显示,可以通过显微镜功能进入异常数据的纬度展开。
如下图:
参数设置
可以在下拉菜单中配置置信区间和回溯天数,如下图:
含义 | 取值区间 | |
---|---|---|
置信区间 | 包含在阈值范围内的数据占全部数据的比例 | 80%-99% |
回溯天数 | 早于所选开始日期的天数,选择足够的天数以便计算更贴合实际情况的阈值范围。 | 至少一个当前所选的日期范围至365天。 |
说明
“置信区间”100%时代表所有的真实数据点都不是异常。
异常标签
激活异常诊断后,数据点的提示框中会出现预测值以及预测的区间值。如果悬停的数据点刚好存在异常,提示框中会出现“异常”标签。
显微镜功能及开启异常诊断
目前异常诊断功能为BETA版,仅支持单一指标进行诊断;如果您使用有任何建议和反馈,欢迎给到我们反馈。
说明
* 在没有通过显微镜点击进入异常诊断前,异常诊断中不会显示数据; * 在维度明细中会罗列查询指标数据异常中,“参考值”和“实际值”包含的所有属性属性维度,每页默认会展示20个纬度,也可以在右下角位置进行重新设置展示的条数(如下图)。
说明
* 搜索:可以搜索指标的属性维度; * 指标:事件分析中选择的指标; * 参考值:期望值; * 实际值:异常点实际数据; * 差异:实际值和期望值之间的差异。