数据同步完成后,平台会自动统计三张表的数据量及每个字段的分布,每天产出一份「统计分析报告」,便于了解数据分布情况,包含:
- 数据量统计:统计三张表的数据量趋势、各场景&各行为类型的行为数据量趋势,同时支持对行为数据做重复率统计。
- 字段分布统计:
- 针对数值型字段,支持统计最小值、最大值、平均值等统计数据,且支持查看分布图。
- 针对字符串、复杂类型数据,支持查看Top50枚举值。
- url 类字段暂不统计分布,包括内容行业item表的cover、pic_url、video_url。
统计分析报告产出的条件
- 用户表/物品表:开始时间到当天的数据连续时,才可产出【数据量统计】和【字段分布统计】。
- 行为表:
- 当天有行为数据时,可产出【数据量统计(除去重统计)】和【字段分布统计】;
- 开始时间到当天的数据连续时,才可产出【去重统计】部分的报告(原因:去重统计目前在归因任务中执行,存在时间依赖)。
注意
若将天级数据传入当天分区,统计分析报告会在第二天才开始产出(天级数据任务为T+1执行)