即行为表所有字段完全一样的数据,平台会直接剔除。
即对于一定时间窗口(可在平台配置)内的行为数据,平台会打去重标记,训练样本和效果数据可选用去重前/后数据,AB报告使用去重后数据。
去重字段:针对设置的字段完全一样的行为数据做去重。
时间窗口:去重时间窗口为动态时间窗口,如对于点击行为,去重时间窗口为30s,则:第一次点击行为时间戳为1641916801,那么在(1641916801,1641916801+30)窗口内的点击行为都算作重复,首条数据不算;下次点击行为去重窗口的开始时间为不在上次时间窗口内第一条点击行为的时间戳,以此类推。
时间窗口:平台支持去重的行为类型因行业而异,每一种行为类型支持配置时间窗口。
去重字段:user_id和bhv_type默认必选且不可取消,支持选择行为表内其他字段,可多选。
字段处理方式(高级配置):对指定行为类型下、指定字段进行特殊处理,包括求和(该时间窗口内的所有行为数据,对该字段求和后,赋予第一条数据,不覆盖原值)和取最大值(该时间窗口内的所有行为数据,对该字段取最大值后,赋予第一条数据,不覆盖原值)。
各行业支持对行业相关的所有行为做去重,详细行为类型如下:
说明
当用户在行为表中添加自定义行为时,同时支持对该自定义行为进行去重配置。
在去重配置页面,单击右上角的「编辑」按钮,即可修改去重配置。
修改完去重配置后单击「确认」按钮,弹出「确认提交去重配置吗?」窗口,弹窗中可选择重跑的阶段(测试、历史、增量)和周期,选择「提交并重跑」表示提交配置并即刻重跑;选择「仅提交」表示暂不重跑仅提交配置更改。