智能推荐平台依托字节跳动领先的大规模机器学习和个性化推荐技术,借助在信息资讯、视频直播、社交、电商等多个领域的能力积累,为客户提供端到端的一站式推荐服务能力搭建的平台,满足不同场景客户的推荐需求。
智能推荐平台通过API的方式接入客户各类业务数据,通过对数据进行清洗和质量校验后,进行特征工程、抽取特征构建样本,客户可自定义模型开发,并通过服务流串联起召回、排序、规则等模块实现线上服务。同时提供ab测试等工具验证推荐效果。
项目(旧版): 项目是在智能推荐平台完成推荐服务的一条完整线路。主要用于管理一个推荐流程下的数据(测试+历史+增量)、特征、模型、服务流,方便用户更简单地使用平台。一个项目只能绑定一个行业模版和一个推荐类型。
应用(新版): 应用是在智能推荐平台完成推荐服务的一条完整线路。一个公司可能会有多个应用,应用主要用于管理一个推荐流程下的数据、特征、模型、在线服务,方便用户更简单地使用平台。一个应用只能绑定一个行业模版。
栏位: 栏位指的是推荐的位置集合,可以包含一个或者多个spm,栏位下需要配置一套在线服务的策略(包括召回策略、排序策略和业务规则)。
行业模版: 是平台预置的基于不同行业业务的推荐业务模板,也指客户应用推荐的实际行业领域。当前支持的行业类型为电商行业、内容行业(长视频、内容社区)。
推荐类型: 电商行业和内容行业目前支持“猜你喜欢”推荐类型,即根据用户兴趣,推荐给用户感兴趣的物品,达到“千人千面”的效果。后续将逐步拓展相关推荐、热门推荐、沉浸式推荐等推荐类型。
数据表: 包含用户表、商品表(或内容表,因行业而异)、行为表。
场景: 场景用于标识行为发生的位置,在平台上使用SPM来区分。以电商行业为例,SPM位置编码由A/B/C/D四段构成, 各分段分别代表 A:业务, B:页面, C:页面区块, D:区块内点位。段之间用$##$分隔,即A$##$B$##$C$##$D,详细传输规范参考行业数据模版。场景标识非常重要,数据校验报告、AB实验报告中均需要查看分场景(通常取spm前三段)的指标。
归因分析: 用于计算用户行为(例如电商行业的商品购买成功、长视频行业的视频播放等)的产生主要来源于前面哪些场景下的哪些行为。将整个时间线上的用户行为经过去重后,构建一个转化路径图。例如电商行业常见的归因路径:曝光-点击-加入购物车-下单-转化(购买成功)。
特征工程: 特征工程可以基于行业模板自动化处理,也可以自主开发。启用行业模板后,可基于业务目标,自动化完成从数据到样本的生成,包含特征预处理、特征抽取、样本生成等阶段。自主开发则可以更灵活地定义数据表、数据处理任务,灵活扩展特征及样本的定义。
策略管理: 包含召回策略及业务规则的管理。支持直接使用内置的召回策略/业务规则,也支持创建自定义召回策略/自定义业务规则。自定义召回策略,目前仅在私有化环境下支持“添加召回”;自定义业务规则目前支持 3 种,“自定义过滤”、“自定义重排”和“自定义返回字段”。
在线服务: 是指构建推荐引擎的服务流程,平台以可视化的方式呈现,支持对召回、排序(精排)、规则模块进行配置。通过构建可视化、可配置的在线服务,让用户可以更清晰地明确流程及对应环节的交互配置。
召回: 召回是推荐系统的关键问题之一,指从全量的商品集合中筛选出一定数量的符合用户需求的商品,并将商品提供给下游的“排序”环节。
排序: 该模块可以对“召回”的商品进行更精细的计算排序,返回特定数量的商品排序。
AB测试: 为了验证一个新策略的效果,准备原策略A和新策略B两种方案。 随后在总体用户中取出一小部分,将这部分用户完全随机地分在两个组中,使两组用户在统计角度无差别。将原策略A和新策略B分别展示给不同的用户组,一段时间后,结合统计方法分析数据,得到两种策略生效后指标的变化结果,并以此判断新策略B是否符合预期。上述过程即A/B实验。