数据校验后的落库及归因过程中对字段进行了预置处理,具体逻辑可参考下表。
表名称 | 新增字段名 | 字段说明 |
---|---|---|
行为表 | origin_parent_item_id | 原始的 parent_item_id,用户同步的 parent_item_id 字段会经过 fnv hash 处理后覆盖原字段名 |
origin_item_id | 原始的 item_id,用户同步的 item_id 字段会经过 fnv hash 处理后覆盖原字段名 | |
receive_timestamp | 服务器接收到数据的秒级时间戳 | |
ts | 系统默认生成的分区归档字段 | |
page | 抽取 spm 第二段作为场景 page | |
用户表 | receive_timestamp | 服务器接收到数据的秒级时间戳 |
ts | 系统默认生成的分区归档字段 | |
物品表 | receive_timestamp | 服务器接收到数据的秒级时间戳 |
ts | 系统默认生成的分区归档字段 | |
origin_item_id | 原始的 item_id,用户同步的 item_id 字段会经过 fnv hash 处理后覆盖原字段名 |
表名称 | 新增字段名 | 字段说明 |
---|---|---|
行为表 | att_is_dup | 去重标记,0:非重复,1:重复 |
att_trace_id | 归因生成 trace_id | |
att_traced | 归因标记,0:归因失败,1:归因成功 | |
att_father_bhv_type | 归因父节点行为,多个用$##$拼接 | |
fake_context_id | mock context_id 字段 | |
_final_request_id | 内部生成 request_id 字段用于样本拼接,如果客户数据中同步 request_id 且不为空则为 request_id 值,否则根据 | |
origin_{} | 数据预处理去重功能中,对于高级聚合的字段会将去重前的原始字段保留到 origin_{} 字段 | |
att_origin_{} | 数据预处理归因功能中,对于要归因的字段会将归因前的原始字段保留到 att_origin_{} 字段 | |
req_time | bhv_time 归因后的字段名,原 bhv_time 字段值不变 | |
用户、物品表 | _create_time | 用户/物品 ID 创建的时间 |
_update_time | 用户/物品 ID 更新的时间 | |
_final_update_time | coalesce('update_time', 'ts'),用于上传 tbase 指定写入的时间戳信息,避免批流数据写入覆盖 | |
_err_fields_case | 数据校验异常字段 case 信息 |