在新增业务需求时,比如各类基础数据、报表需要新开发数据,作为数据负责人,应该对上线前的数据进行测试,保证数据符合业务预期,避免下游用户因为数据错误导致决策失误。
主要探查的内容包括:数据量、主键、空值、枚举值等。
整表探查
表行数:计算所选数据源的表行数总量,计算方式为count(*)
主键重复:根据用户指定的主键进行group by,将count(*)大于1的主键展示出来
字段空值:根据用户选择的字段及空值定义,计算该字段的空值占比
字段枚举值:根据用户指定的字段,分别计算其枚举值及数量,如:select 枚举字段1, count(*) from table group by 枚举字段1
分组探查
当用户需要从某个维度拆解数据探查的结果时(等价于group by),可以用到分组探查功能。若用户不需要分组查看探查结果,可以不开启该功能。
目前分组探查支持分组查看行数、空值及枚举值三种探查指标。若用户探查了该类指标,可以通过分组快速查看各个组下面的指标表现情况。