系统监控是对平台在线服务的相关指标的监控。可以查看单个在线服务的相关指标数据,也可以查看某个栏位下的整体统计情况。
系统目前支持的指标有:
- 请求次数相关指标:监控推荐API的QPS(每秒请求次数),包含所有请求次数以及成功/失败的次数。
- 请求耗时相关指标:监控推荐API的请求耗时,包含请求的平均耗时以及p99(99%分位数)请求耗时。
- 返回候选数:每次请求返回结果的数量,即在线服务返回给API的数量,不等于API实际返回数量(可能会有兜底情况);如果数量远低于配置的曝光数量,可能是服务流召回数量不足或者配置了过于严格的过滤策略。
- 返回候选为空的次数:返回结果为空的次数,即在线服务返回给API的结果为空次数,不等于API实际返回结果为空次数(可能会有兜底情况);请求返回空值会影响推荐效果。包含异常触发兜底的请求。
- 各路召回数量:每次请求各路召回规则返回数据量均值及占比。