汽车营销有丰富的意向推荐场景,比如常见的选装包意向推荐、潜客购车意向预判、换新/维修意向,结合用户全生命周期的管理,对不同生命周期采取不同的营销策略:
对无感知用户:汽车品牌/车型介绍,学车知识推送
本案例针对计划购车/即将购车/老车主的场景,采用机器学习的方式,推算用户的购车意向,用历史留存成功营销购车/换购的用户数据来做训练,对符合三种生命周期的用户做购车意向预测,并采取合适的营销手段
字段名称 | 字段类型 | 字段意义 | 字段说明 |
uid | bigint | 用户id | |
gender | string | 性别 | 性别:男、女 |
age | string | 年龄段 | 年龄段:18-23、24-30、31-40、41-50、51- |
area | string | 常驻地 | 常驻地-区 |
lifestage | string | 人生阶段 | 人生阶段:征婚、备婚、孕期、已育 |
education | string | 学历 | 学历:高中及以下、专科、本科、硕士及以上 |
job | string | 职业 | 职业:留学生、医生、律师、教师、蓝领、白领、其余 |
birthday | string | 生日 | 生日 |
lifecycle | string | 生命周期 | 生命周期:粉丝、潜客、车主、流失 |
own_store | string | 所属门店 | 所属门店:中环广汇、浦东永达、其余 |
own_sales | string | 负责销售 | 负责销售:道森、王宁、罗伯特 |
wanted_store | string | 意向经销商: | 意向经销商:浦东永达、中环广汇 |
wanted_carmodel | string | 意向车型 | 意向车型:RX5 Plus、ER6、RX3、i5、i6、iMAX8、未知 |
rank | string | 意向评级 | 意向评级:高、中、低、已成交 |
lasttime_pudongyongda_testdrive | string | 上次门店试驾时间 | 上次门店试驾时间:1周内、2周内、1月内、2月内、3月内、半年内、一年内 |
newcar_tasting | string | 新车品鉴会 | 新车品鉴会:是、否 |
storetimes_lastthreemonth | string | 近3个月访问经销商次数 | 近3个月访问经销商次数:0、1、2、3、4、>4 |
storenumbers_lastthreemonth | string | 近3个月访问经销商个数 | 近3个月访问经销商个数:0、1、2、3、4、>4 |
warranty_times | int | 质保期内进店次数 | 质保期内进店次数:0、1、2、3、4、5 |
warranty_values | string | 质保期内服务总价值 | 质保期内服务总价值:0~ 3000、3000~ 5000、5000~ 10000、> 10000 |
pudongyongda_noentry_time | string | 未进入本店时长 | 未进入本店(浦东永达)时长:1个月、2个月、3个月、4个月、5个月、6个月、7个月、8个月、9个月、10个月、11个月、12个月 |
forwardtimes_lastthreemonth | string | 近3个月累计转发 | 近3个月累计转发:< 3、3~ 5、6~ 10、> 10 |
publishtimes_lastmonth | string | 近1个月发帖数 | 近1个月发帖数:0、1、2、3、4、>4 |
applets_opentimes_lastmonth | int | 近1个月小程序打开次数 | 近1个月小程序打开次数 |
optionalpackpage_opentimes_lastmonth | int | 近一个月选装包页打开次数 | 近一个月选装包页打开次数 |
optionalpackpage_time_lastmonth | int | 近一个月选装包页浏览时长 | 近一个月选装包页浏览时长。单位:min |
last_eta | int | 当前eta | 当前eta。单位:天 |
eta_modifytimes | string | eta修改次数 | eta修改次数:0、1、2、3、4、>4 |
pointuse_lastmonth | string | 近一个月是否使用过积分 | 近一个月是否使用过积分:是、否 |
point_count | string | 积分量 | 积分量:0-500、500-10000、10000-30000、30000以上 |
active_lasttime | string | 上一次活跃时间 | 上一次活跃时间 |
contact_preference | string | 触点偏好 | 触点偏好 |
gift_preference | string | 精品品类偏好 | 精品品类偏好 |
carowner | string | 本品车主 | 本品车主 |
salescarmodel | string | 本品成交车型 | 本品成交车型 |
salestime | string | 本品成交日期 | 本品成交日期 |
carownerappvisit | string | 车主app访问频率 | 车主app访问频率 |
othercarmodel | string | 其余持有车型 | 其余持有车型 |
interest_car_price | string | 汽车价格 | 汽车价格 |
interest_car_brand_country | string | 汽车国别 | 汽车国别 |
interest_car_brand | string | 汽车品牌 | 汽车品牌 |
interest_car_other_series_type | string | 汽车车型 | 汽车车型 |
interest_car_newenergy_type | string | 新能源类型 | 新能源类型 |
client_stage | string | 客户阶段 | 客户阶段 |
channel | string | 留资渠道 | 留资渠道 |
community_pv_lastweek | int | 过去一周的社区pv | 过去一周的社区pv |
community_creation_lastweek | int | 过去一周的社区内容创造 | 过去一周的社区内容创造 |
community_forward_lastweek | int | 过去一周的社区转发 | 过去一周的社区转发 |
community_recruit_lastweek | int | 过去一周的社区拉新 | 过去一周的社区拉新 |
car_optical_pack_eagerness | string | 选装包偏好 | 选装包偏好 |
car_pick_up_eagerness | string | 提车迫切度 | 提车迫切度 |
returned_customer | string | 回头客 | 回头客 |
car_price_comparison | string | 跨店比价 | 跨店比价 |
stored_many_points | string | 积分大量囤积 | 积分大量囤积 |
club_freshman | string | 俱乐部新手 | 俱乐部新手 |
recall_values | string | 流失召回价值 | 流失召回价值 |
数据中包含了大部分经过数据处理的关键性指标,包括用户的生命周期/活跃度/渠道信息/个人属性等,利用这样结构化的数据,直接经过简单的建模,可以对意向评级进行预测,从而进行精准营销。
hive数据接入,数据准备支持直连hive数据源,简单的将数据搜索+拖拉即可接入数据,此案例分为两份数据,历史手工标记数据+新产生数据,对历史标记数据针对意向评级进行分类训练,对新数据进行意向预测。
我们选择核心的指标进行意向训练,由于事前我们数据进行了处理,可以理解所有的指标都核心影响意向的选择,所以这里无须进行特征筛选/特征处理工作,经过简单的逻辑回归,即可达到目标要求
数据准备模块支持训练模型评估的功能,辅助用户手动调参。参考上图的混淆矩阵,显示了模型最终效果的召回和精确率,显示不同分类情况下,用测试集的性能,同时支持加权召回率、加权查准率、准确率的计算
在得到效果较好的模型之后,可以将预测的结果输出到hive/clickhosue,后续可以结合ABI进行分析处理。同时也可以对接CDP平台,对该指标进行标签洞察/营销应用/用户分群中投入生产使用