You need to enable JavaScript to run this app.
导航
事件分析
最近更新时间:2024.11.11 17:59:53首次发布时间:2024.04.30 15:17:10

事件分析作为数据分析最重要的分析方法之一,能够帮助我们研究某行为事件的发生对企业所产生的价值影响。火山引擎增长分析「事件分析」支持通过构建指标、分组筛选及多种可视化图表对用户行为进行多维分析,同时在数据智能洞察方面提供了异常数据分析的功能,可以帮助我们发现更多数据异常带来的影响。

1. 背景信息

1.1 相关概念

进行事件分析前,您需要了解事件分析工具涉及的主要概念,帮助您了解事件分析工具的分析逻辑,简介如下,详细的事件分析工具涉及的数据模型相关概念的介绍请参见数据模型

术语

概念介绍

事件(Event)

事件即用户行为的数据化描述。例如,在某视频APP中,用户观看了内容A后对博主推荐的商品产生了兴趣,随后点击了评论区中商品链接,在电商中完成了购买。观看视频、点击链接、下单购买等一系列用户行为,在通过埋点数据化后即可通过“事件”来描述。

属性(Params)

在火山引擎增长分析平台中,我们通过“事件名称+属性列表”组合的方式来详细准确的描述用户行为:

  • 通过事件名称用以区分不同类型用户行为,如“video_play(播放视频)“、“like(点赞)”。
  • 通过属性对事件进行详细描述,如通过“video_id=12358”、“play_mode=normal”进行进一步描述播放的具体视频及播放方式。

注意

在增长分析平台中,属性目前支持字符串(string)和数值(int)两种取值类型。

  • string类型属性如video_id、video_name。
  • int类型属性如video_play_time(视频播放的时长)。

根据应用范围,属性又分为“事件属性”和“公共属性”两类。

事件属性

与单个或几个事件相关的属性,用以对这些事件进行展开描述,如video_play事件的video_id、video_name、play_mode属性,或video_add_favorite事件的video_id属性。

公共属性

包括用户属性和场景属性,可以为所有事件所共用。用户属性如用户的年龄、性别,场景属性如app版本、ip地址等。

指标

数据分析的指标与分析的业务目标相关,通常可通过量化的事件数值来体现待分析的业务指标**。DataFinder中可通过**选择事件、事件/属性数值的计算方式来定义事件分析的指标,并支持通过属性的过滤条件进行过滤分析。
例如,某页面访问的UV、PV、人均次数、时长、点击率、渗透率、留存率、成功率等。指标可以分为计数型指标和复合型指标,如UV、PV、订单。

1.2 应用场景

事件分析是研究用户行为的常用手段,典型的使用场景包括(但不限于):

  • 产品团队:统计用户对产品功能(如搜索、视频播放、加收藏等)的使用情况;
  • 用户运营团队:统计不同细分人群的运营转化情况,如不同促销活动参与(如领取过活动优惠券)用户的后续转化(使用优惠券下单购买商品)情况;
  • 内容运营团队:统计用户使用和消费内容的情况,如统计视频app中各视频内容的播放人数、播放次数及播放时长等;
  • 市场团队:统计不同渠道用户的转化情况,如统计对比不同应用市场带来app新用户的付费人数;
  • 分析师团队:可以快速展开多维下钻分析,配置出业务相关的分析指标。

火山引擎增长分析提供的事件分析功能非常灵活,可以很好的满足各类场景下的统计需求。

1.3 支持的指标算子(Metric)

增长分析平台的事件分析,支持以下指标的统计分析:

指标算子

含义

举例

总次数(PV)

统计事件的发生次数

统计用户在app内播放视频的总次数

总人数(UV)

统计事件的发生人数

统计在app内播放过视频的去重用户总数

渗透率(UV/AU)

事件触发总人数/全部活跃人数,其中分母为any_active_event事件的触发人数

说明

any_active_event为系统预置事件,详情请参见跨端预置属性

查看新功能上线后活跃用户的使用占比情况

人均次数(PV/UV)

即 pv/uv,事件的人均发生次数

统计用户播放视频的人均次数:pv/uv

全活跃用户人均次数(PV/AU)

事件触发总次数/全部活跃人数,其中分母为any_active_event事件的触发人数

查看新功能上线后活跃用户的人均使用次数情况

按…求和(SUM)

按事件的数值型属性求和

统计视频播放的总时长:sum(video_play_duration)

按...求最大值(MAX)

某属性的值的最大值,只支持数值型属性

看视频播放时长的最大值

按...求最小值(MIN)

某属性的值的最小值,只支持数值型属性

看视频播放时长的最小值

按…求平均值

某属性的值之和/事件发生次数,只支持数值型属性

统计视频播放的平均时长:sum(video_play_time)/pv

按…求人均值

某属性的值之和/事件发生人数,只支持数值型属性

统计视频播放的人均时长:sum(video_play_time)/uv

按...求全活跃用户人均值

某数值型属性的值之和/全部活跃人数,其中分母为any_active_event事件的触发人数

统计活跃用户的视频播放的人均时长:sum(video_play_time)/全部活跃人数

按…求分位数

即把单位时间范围内的数据按从小到大排序后,求处在某一分位上的数;
常见的比如中位数(50%分位数)、90%分位数等,只支持数值型。

查看每日用户发生目标事件(此处为看视频)的次数分布情况

按…求去重数

即对事件参数进行去重统计

统计播放视频事件中播放过的视频数

按…和用户去重

即对事件参数和做过该事件的用户进行去重统计

统计用户看过的视频个数总和

注意

数值型属性目前特指int/float两种类型。

2. 功能使用

2.1 功能界面组成

使用事件分析工具前,您可以先浏览事件分析工具界面,了解主要功能模块,事件分析功能界面由以下部分组成。

界面示例

页面模块简介

Image
Image
Image

  • 事件选择:可选择要分析的一个或多个目标事件;
  • 细分筛选:通过用户群和公共属性过滤分析的用户;
  • 属性分组:通过事件属性、公共属性设定分组展示条件;
  • 事件分析图表:通过可视化图表展示分析结果;
  • 详细数据:分析结果的详细数据表;
  • 异常诊断:针对异常数据展开常用维度分析;
  • 行列转置:可以将分析图表的数据进行行列的展示调整;
  • 下载数据:可以下载详细的数据到本地;
  • 保存到看板:将当前分析结果保存到看板。

其他通用配置
Image

  • 分析模式:支持切换为事件分析或session分析。本文以结束事件分析为主,session分析内容请参见自定义Session分析
  • 统计口径:可切换当前分析数据的统计口径,支持选择的统计口径可在元数据管理的统计口径中查看,详情请参见统计口径
  • 时区:可切换当前分析数据的时区,支持的时区配置可在项目中心/应用管理的通用设置-多时区配置中查看。
  • 主体:多主体功能当前仅针对业务相对复杂的SaaS-云原生、私有化用户客户按需开放,详情请参见多应用/多主体/多ID类型概述

事件分析工具的使用流程和各个模块的详细使用指导可查看下文详细介绍。

2.2 配置分析指标

登录并进入DataFinder控制台后,在顶部选择选择分析工具>高级分析>事件分析,进入事件分析工具页面,然后选择要分析的目标事件和统计指标,操作步骤如下。
Image

  1. 添加指标。
    选择要分析的指标事件及指标事件的计算算子。
    • 当前指标事件支持选择“一般事件”、“虚拟事件”和“圈选事件”三类事件。
    • 如果当前指标事件下拉框中没有您希望分析的指标事件,可前往数据管理>元数据管理的“一般事件”、“虚拟事件”和“圈选事件”页面中查看事件是否存在。
  2. (可选)添加指标的过滤条件。
    您可根据需要为事件添加过滤条件,支持配置多个过滤条件,并指定过滤条件间的逻辑关系为“且”、“或”。

    说明

    选择过滤条件的时间属性值时,当前界面下拉框中最多支持展示1000个属性值,如果您的属性值超过1000个且需要使用的属性值不在下拉框中被展示出来,您可以通过搜索的方式查找并选择对应的属性值。

    对于字符串属性,还支持如下特征:
    1. 点击“切换”按钮,将过滤条件的添加方式从选择变为手动录入(支持复制粘贴)。
    2. 通过正则表达式匹配,注意正则表达式仅支持 re2 语法。
  3. (可选)添加自定义指标。
    如果您希望对已添加的指标进行自定义的计算,将计算结果也作为指标进行分析,您可以创建自定义指标,实现指标间的计算,并可选是否同时展示原子指标。注意:
    1. 未添加“自定义指标”时,折线图分别展示各事件的走势变化;
    2. 当已添加了自定义指标时,点击计算,折线图会额外展示所有组合结果的走势情况;
    3. 当选择了具体的按事件属性分组,则折线图在以上事件数据逻辑上,再按具体属性进行分组展示。
  4. (可选)添加多个指标。
    您可以将鼠标悬浮至已添加的指标上,点击上方的复制按钮可复制配置好的指标,或者点击「+事件指标」、「+自定义指标」,快速复制已有的指标,重复以上步骤,配置更多指标。

    注意

    事件指标+自定义指标最多添加50组。

  5. 指标重命名。
    添加指标后,DataFinder根据选择的指标事件和算子自动为您生成指标名称,您也可以将鼠标悬浮至指标上,单击指标名后的编辑按钮,对指标进行重新命名,便于后续识别指标。
  6. 对于常用的配置,可以快捷保存为指标,以便下次直接筛选。

    说明

    不支持指标嵌套,即已保存的指标再次出现在另一个保存的指标中。如保存的自定义指标未在下拉的指标列表出现,请在指标管理页面检查是否存在不关联的指标嵌套。

    Image

2.3 配置细分筛选(原“全局筛选”)

细分筛选主要是用来进行用户的过滤筛选,确定需要分析的是符合哪些条件的用户。例如,筛选「城市是东营、商丘,用户分群为测试」的用户进行对应指标的分析。
Image

  1. 配置一级筛选条件和二级过滤条件。
    • 在细分筛选区域选择要分析的用户的一级过滤条件,过滤逻辑详情可参考文内分群
      • 属性过滤:事件属性、用户分群、用户属性、用户标签(如开启)等。其中用户分群默认选择最新一日计算结果,可通过点击“最新数据”切换计算逻辑,指定某一日结果。
      • 行为圈选:在指定时间范围内“做过/没做过/依次做过XX行为”的用户。
      • 动态匹配:通过事件与人群在指定时间间隔动态匹配筛选。
    • 您可以单击下方的**+属性过滤**、+行为圈选+动态圈选,添加多个一级过滤条件,多个过滤条件间的逻辑关系可设置为AND或者OR
    • 您可以将鼠标悬浮在过滤条件后方,为过滤条件添加二级过滤条件。支持添加多个二级过滤条件,多个二级过滤条件间的逻辑关系可设置为AND或者OR
      Image
  2. 添加对照组。
    • 您可单击**+对照组**,相当于把结果分组对照展示来看。
    • 支持创建多个对照组,也可复制已创建的对照组。
  3. 其他支持操作:
    • 修改各筛选组的名称。
      您可单击筛选组名称后的“小铅笔”按钮,对筛选出的用户群进行改名,便于记忆。
    • 批量录入筛选条件。
      您可以单击筛选条件后的“小铅笔”按钮,根据界面提示批量录入筛选条件,提高配置效率。

2.4 配置属性分组

  • 设定用于分组的事件属性或用户属性,以便对统计结果按照选定的属性维度进行对比;
  • 属性分组支持按照事件属性、用户属性、用户标签进行分组,一共最多支持20层分组。

Image

2.5 查看事件分析图表

查看分析结果的可视化图表,并根据需求进行调整。
Image
默认情况下,系统会自动以折线图的方式展示过去7天的统计结果。
您可以根据需求对分析图表进行以下调整:

  • 设定分析的时间粒度:5分钟级、小时级、天级、周级、月级;

  • 可通过日历组件进行快捷设定分析时间段和自定义时间段;
    Image

    • 快捷设定时间说明

      粒度

      快捷设定分析时间段

      过去N..

      最新(今天、本周周、本月等)

      次新(昨天、上周、上月等)

      5分钟

      今天, 昨天
      过去2天

      今天

      昨天

      小时

      今天, 昨天, 本周, 上周
      过去2天, 过去7天

      今天

      昨天

      今天, 昨天, 本周, 上周, 本月, 上月
      过去5天, 过去7天, 过去14天, 过去30天, 过去60天, 过去180天

      今天

      昨天

      本周, 上周, 本月, 上月
      过去2周, 过去4周, 过去8周, 过去16周, 过去50周, 过去100周

      今天

      昨天

      本月, 上月
      过去2月, 过去3月, 过去6月, 过去12月, 过去24月

      今天

      昨天

    • 自定义设定时间说明:具体时间至昨天、今天、n天前;n天前至昨天、今天、n天前。

  • 可进行时间的对比的选择:上一周期、上同周期、去年同期、自定义时间;

    日期

    含义

    上一周期

    首尾相接的上一段时间

    上周同期

    向前平移一周,每周顺序对应。

    上月同期

    向前平移一月,每月顺序对应,考虑到每个月天数不一致,无法直接平移一个月,因此不支持该选项。

    去年同期

    向前平移一年,相应月份和日期对应,具体策略为:直接改变年份,然后用对比时间的结束时间减去被对比时间的时间区间,得到对比时间的开始时间即可。

    Image

  • 选择可视化图表类型:折线图、堆叠面积图、柱形图、双轴图;

  • 对分析时间段进行缩放,以查看更细或更完整的数据图表;

  • 当图表为“天级 折线图”时,点击线图上的点,就会显示显微镜功能(新建日期批注、存为用户分群、导出用户);

  • 当事件分析组自定义指标,且图表为“天级 折线图”时,显微镜功能只支持“新建日期批注”。(更详细的显微镜功能,可参见显微镜功能

  • 当事件分析多指标或多分组值时,支持配置双轴展示;

  • 可修改图例“A1 页面访问(总次数)”的名称,且保存图表为看板后,名称可同步到看板。

柱形图-指标说明:

  1. 查看pv时,柱形表示时间区间内各分组pv加和;
  2. 查看uv时,柱形就表示时间区间内用户去重;
  3. 查看pv/uv时,用各分组的上述1、2两个计算结果进行对应的比值计算;
  4. 查看按……求sum时,将时间区间内所有的该属性取值进行加和;
  5. 查看按……求平均值/人均值时,用上述4的结果与1、2的结果进行比值计算;
  6. 查看去重数时,柱形表示整个时间区间的去重数结果;
  7. 查看分位数时,柱形表示在整个时间区间内求的分位数结果。

说明

如果您希望查看对照组和日期对比的柱状图,请使用“堆叠图”图表样式查看。

2.6 查看详细数据

展示统计结果的详细数据表。
Image
详细数据表支持以下操作:

  • 支持行列转置;转置后指标名将展示于列;由于表格可展示的分组数有限,如存在多指标与多分组值时,转置后的表格将默认以配置的指标顺序取第一个有数据的指标的分组依次向后对齐。Image
  • 支持对事件、事件属性、用户属性以及统计结果进行排序;
  • 可下载为excel文件。

2.7 保存分析结果到看板

将需要长期监测的指标图表添加到看板中。
Image
点击右上角的「保存到看板」,对要保存的看板进行操作:

  1. 图表名称:可以对图表进行重新命名,比如当前的指标为“页面访问DAU”,这样方便后续查看;
  2. 保存位置:可以选择个人和公共空间,更多介绍可以查看看板概述中对于个人和公共空间的描述;
  3. 保存路径:可以选择需要保存的位置;
  4. 选择图表类型:可以对当前的指标选择合适的展示方式,比如金额可以选择指标卡,uv的趋势可以选择折线图,如果有2个事件可以选择双轴展示等;
  5. 同时展示:如果希望在展示主要的图表类型中同时有合计值、环比等这样的展示,可以进行选择,比如选择了一个指标本双周新增用户数通过指标卡展示后,希望也看到具体环比、同比变化,就可以进行选择了,如下图;
    Image

3. 使用示例

【配置指标】最近XX天日活用户数据

Image

【配置指标】计算停留时长 pct 95

Image

Image

【自定义指标】渗透率计算

【细分筛选】对比高、中、低活跃用户的人均使用次数

【属性分组】查看不同系统版本下的日活用户数据

能看到不同版本下的数据情况,会以从高到低排序展示。与此同时还能看到上报的格式是怎么样的,展示原始上报的属性值字段。下图就是「系统版本=X.X.X」。
Image
Image

【同环比】对比上一周期的数据情况

4.智能分析-异常诊断

4.1 什么是异常诊断?

在进行趋势分析时,数据的异常波动对于我们发现业务上的问题或机会有重要的提示作用。我们常常会基于经验判断波动是否正常,但常常会忽略一些看似正常,但并不符合波动规律的数据。通过异常诊断我们可以快速发现这些异常数据并展开常用的维度,可以很好的帮助业务人员定位数据波动的原因。

  • 异常数据是如何发现的?
    借助异常诊断,我们会基于历史数据找到周期性规律,预测出查询时间内符合该规律的数据范围,辅助使用者发现异常数据,避免错失机会和问题。
  • 展开常用维度的价值大吗?
    通常情况下,发现到数据异常波动后,往往需要通过不同维度组合、下钻来定位可能引发波动的维度。这个过程往往因为维度过多、分析人员的经验不足而变得非常困难。
    在增长分析产品中通过一次展开常用维度可以快速发现贡献度较高的维度及维度组合,节省了一个个维度下钻的时间,也降低了定位数据波动问题的门槛。

4.2 操作说明

4.2.1 功能激活
当事件分析中事件和对照组的乘积不超过10(如2个事件*对照组5个=10个 可用,事件3个&对照组4个=12个 不可用)并且图表类型是折线图时,会激活“异常诊断”功能。

图表类型

事件数量(含自定义指标) * 对照组数量

事件属性 + 公共属性分组

折线图

<= 10

如下图:
Image
4.2.2 图表区说明
异常诊断功能激活后,系统会取回溯天数内的数据进行计算,预测拟合出当前查询时间范围内的数据并以虚线显示在图中。虚线背后颜色较浅的色带表示符合预期的数据范围,色带的宽度由“置信区间”来决定。置信区间数值越大,表示宽容度越高,则更多的实线上的实际数据就会出现在色带范围中,而那些没有出现在色带范围内的实线上的数据点,则会被标记为“异常”点,以红色高亮显示,可以通过显微镜功能进入异常数据的纬度展开。
如下图:
Image

  • 参数设置
    可以在下拉菜单中配置置信区间和回溯天数,如下图:
    Image

    含义

    取值区间

    置信区间

    包含在阈值范围内的数据占全部数据的比例

    80%-99%
    默认:95。

    回溯天数

    早于所选开始日期的天数,选择足够的天数以便计算更贴合实际情况的阈值范围。

    至少一个当前所选的日期范围至365天。
    默认:5分钟级:1天(范围:1,2)小时级:3天(范围:1 - 7)天级:60天(范围:1 - 90)周级 & 月级:180天(范围:1 - 180)

    说明

    “置信区间”100%时代表所有的真实数据点都不是异常。

  • 异常标签
    激活异常诊断后,数据点的提示框中会出现预测值以及预测的区间值。如果悬停的数据点刚好存在异常,提示框中会出现“异常”标签。

  • 显微镜功能及开启异常诊断

    目前异常诊断功能为BETA版,仅支持单一指标进行诊断;如果您使用有任何建议和反馈,欢迎给到我们反馈。

    1. 点击有异常的数据点,会出现显微镜功能,通过显微镜功能我们点击进入异常诊断,如下图:
      Image
    2. 进入异常诊断后,我们会在底部看到详细的数据,如下图:
      Image

      说明

      * 在没有通过显微镜点击进入异常诊断前,异常诊断中不会显示数据;
        * 在维度明细中会罗列查询指标数据异常中,“参考值”和“实际值”包含的所有属性属性维度,每页默认会展示20个纬度,也可以在右下角位置进行重新设置展示的条数(如下图)。
      
      Image
    3. 在展开维度上方,有所选中的异常数据的基本信息,包括指标、参考值、实际值、差异,同时可以支持敏捷搜索属性维度,如下图:
      Image

      说明

      * 搜索:可以搜索指标的属性维度;
        * 指标:事件分析中选择的指标;
        * 参考值:期望值;
        * 实际值:异常点实际数据;
        * 差异:实际值和期望值之间的差异。
      
    4. 在展开的维度中,可以选择将该纬度进行“置顶/取消置顶”“置底/取消”,可以选择在新窗口打开,如下图:
      Image
    5. 在新窗口打开后,会进入到按选择的属性维度分组查看的事件分析中,可以进行更加详细的分析,如下图:
      Image

5. 事件分析功能视频讲解
  • 基础功能讲解
  • 高阶功能讲解