目前产品设计 实时规则引擎不支持配置多值文本标签,如果有需求可与PM联系。
实时标签现在只能用实时数据源创建;可以用实时行为+离线标签的方式创建。
运算标签按区间划分、运算结果默认保留两位小数,如果按统计值划分,指定了保留小数位不等于两位,则可能因为小数点保留精度不一致导致数量差异。
标签描述最大支持500个字符。
对于离线标签,系统默认显示与前日此时、前日综合相比之下的指标表现情况。 对于实时标签,系统自动显示与昨日此时、昨日综合相比之下的指标表现情况。
举例如下:
离线标签:假设今天是3号,指标卡的值是2号的数据,前日此时和前日综合都是1号的数据 实时标签:假设今天是3号,指标卡的值是3号的数据(每小时计算一次),昨日此时是指到2号此刻的统计值,昨日综合是指到2号结束的统计值
关键业务指标展示的数据,与所选择的截止时间相关,截止时间如果选择当天,则默认展示昨天的数据;如果选择截止时间是过去1天,则展示的是所选日期的数据。
展示该标签下不同标签值最新时间分区的人数分布,当标签枚举值过多时,至多展示30个标签值的人数分布。
多值标签的标签值分布占比相加可能大于100%,以兴趣标签为例,一个人可能存在多个兴趣值。
设置生命周期标签的时候,可以设置标签值的顺序,满足多个阶段归为后面阶段。
*即:用户分层倒序,同一用户会按照阶段倒序匹配
支持固定日期、动态日期、单个日期及高级日期选择。
1)固定日期选择: 支持选择某一天或一段日期,如2022-01-03~2022-01-03,或2022-01-04~2022-01-13。
2)动态日期选择: 支持选择以今天为基准的一段时间,如最近1/3/7/14/30天、本双月/月、最近3/6月、最近1/2年,或者自定义最近X天(是否包含今天)。
3)单个日期选择: 支持点选某单个日期,如2022-01-12。
4)高级日期选择: 以当前时间为基准的一段时间,如未来7天内(含今天)、过去7天前(含今天)、未来7天后(含今天)、过去2天前-过去4天前等。 产品能力上支持:
仅行为数据支持以事件发生时间为基准的一段时间,如注册时间在xx事件发生的当天/当周/当月、注册时间在xx事件发生的未来/过去3天/秒/分/小时/周等。
秒级更新
目前CDP的标签体系支持4层级
目前是的,后续偏好标签会支持多值文本、多值日期、多值数值。
包含:有一个标签值即可;
包含全部:所有标签值都要有;
比如选择3个值,包含就是命中其中1个就行,全部包含是3个值都要命中。
标签类型是string, DecimalEnum, StringEnum 和Date的时候有全局不包含,比如值类型是float,double,int,到圈人组件里就是Decimal
产品逻辑为当前的全量标签覆盖数与前一日更新的覆盖数做对比,形成覆盖率,超出100%的比例为当天实时标签增长的数量
需要给角色/用户组授权对应的行权限,用户才能看到被授权的覆盖数
TGI 是点击人群该标签值占比/对照人群该标签值的点击占比,结果与 100 相差越远,说明该特征值越显著;CTR 是人群包中点击 Push 人数/人群包接收到 Push 人数,结果数值越大,说明该特征越明显。
可以先看下耗时,如果时间很短的话通常是因为上游建模任务依赖的Hive表数据未就绪建模任务就运行完毕导致的,CDP这边自定义SQL需要我们手动在【输出节点】创建依赖关系,创建后上游数据没有准备好这个建模任务会显示「等待上游就绪」相应的下游的标签任务也会显示「等待上游就绪」。配置的方式是在可视化建模任务中点击编辑-添加输出节点-依赖配置选择相应的表,自定义sql涉及的表都需要增加上。
可以使用 arrayDistinct() 函数对数组进行去重,下面是一个示例:
全量标签覆盖率超过100%是因为全量标签默认以T-1天的离线全量数据作为基准。如果有实时数据进入系统,就会展示超过100%的用户占比。出现这种情况是因为全量标签是实时更新的。当天进入系统的base_id会被计入,因此,多出来的部分是当天实时进入的数据。
使用标签体系功能模块时,需要关注以下产品限制:
【其他】包含实时标签、人工标签,以及异常状态(非运行中、等待就绪、成功、失败)的离线标签
创建客群,规则中有3个标签,配置了依赖。创建人有行权限,行权限的标签是分行,分群是否同时依赖规则中的标签和行权限的标签的任务
分群如果是自动按天调度的话,需要配置分群依赖里面配置了依赖标签,运行的时候会依赖标签,不会依赖行权限标签。手动运行分群,不依赖任何标签,取最新有数的一天。
CDP可以配置使用源表进行导入,不做baseid重复的校验。可以通过 profile_meta环境变量:USE_ORIGIN_TABLE 进行配置打开使用源表的开关。打开使用源表的开关后,CDP每个项目下支持2个属性表使用源表数据,默认是按照创建先后顺序的前两个默认开启使用原表进行导入。之后的其他属性数据使用的是非原表的属性表进行导入,导入时会检查 baseid 是否重复,如果baseid 重复,就会导入失败。
逻辑为使用历史日标签逻辑为先找该历史日的分区,再查询该分区中的数据。日期型标签现阶段不能使用历史日实现客户需求(取上月末近一天),会和产品提相关需求规则标签和生命周期标签
二者都不允许取多值(即:某个体命中A标签值,将不会再次命中B标签值)
规则标签的命中顺序按照标签值tab从左往右依次检验。
生命周期标签的命中顺序按照标签值tab从右往左依次检验。
标签名称项目下唯一,在同一项目下两个主体下的标签名称依然不能重复。
标签类型名称 | mysql中对应的标签类型 |
---|---|
1-规则标签 | rule |
3-导入标签 | import |
4-人工标签 | manual |
6-逻辑标签 | logic |
7-组合标签 | combine |
8-机器学习模型标签 | ml_model |
9-数据清洗模型标签 | etl_model |
10-clickhouseSQL标签 | clickhouse_sql |
11-hiveSQL标签 | hive_sql |
12-多阶段标签 | multi_stage |
13-rfm标签 | rfm |
14-统计标签(CDP1.10) | statistics |
15-首末次标签(CDP1.11) | first_last |
16-智能外呼标签(CDP1.13) | |
17-偏好标签(CDP1.14) | preference |
18-行业模型标签(CDP1.14) | industry_model |
128-全量标签 | mautag |