应用性能监控全链路版的服务端监控具备基础层资源性能监控、服务/代码层监控、线上应用运行健康度监控的后端全链路监控的能力。
服务端监控是应用性能监控全链路版(APM Plus)推出的针对服务端应用的后端全链路监控服务,具备从基础层资源性能监控,到服务、代码层监控,再到线上应用运行健康度监控等能力。服务端监控采用无侵入式插桩方案,您只需在服务器进行简单的配置,即可完成接入。
目前服务端监控提供了以下监控能力。
分类 | 功能 | 说明 |
---|---|---|
看板 | 主机性能 | 预设的主机性能看板。 |
磁盘 | 预设的磁盘性能看板。 | |
平台自监控 | 预设的平台自监控看板。 | |
自定义看板 | 您可以配置自定义看板。 | |
主机监控 | 展示主机列表及其运行状态、CPU使用率、IO、负载信息。 | |
Docker监控 | 展示容器列表及其运行状态、宿主名称、镜像、CPU、内存使用率、启动时间、创建时间等信息。 | |
进程监控 | 展示进程列表及其启动用户、主机名称、CPU、内存使用率、创建时间、结束时间等信息。 | |
日志查询 | 提供日志的消费能力,可以查询日志聚类和日志检索。 | |
服务列表 | 展示全体服务及其服务类型、运行状态、错误率、QPS、延时、CPU使用率、内存使用率、最近查看时间等信息。 | |
服务拓扑 | 展示全局服务拓扑图,反映服务间的调用情况。可以通过服务拓扑快速梳理整体服务架构,上下游调用关系,并且可以实时看到各个服务间调用的成功率,快速发现问题服务。 | |
服务接入 | 提供各语言的接入指引,您参考接入引导可以接入监控。 | |
中间件概览 | 汇总应用服务对中间件的访问情况,从中间件视角统一观测,方便中间件维护人员对中间件进行问题排查。 | |
Trace分析 | 实时检索服务调用等span信息,支持多维检索与排序,用于快速定位错误和慢查询,单击TraceID可以查看请求完整链路。用于定位排查单点问题。 | |
单链路查询 | 提供单点追踪诊断能力,可根据TraceID查询单个请求的完整调用链路,打通日志库后可串联起整个链路的所有日志。用于快速定位排查单点问题。 | |
分析查询 | 展示了所有服务的profile上报数据。 | |
任务管理 | 用于新增、管理profile任务,以及查看该profile任务的上报数据。 | |
全局分析 | 自定义指标 | 展示上报的自定义指标及其自定义维度,支持搜索与筛选,可方便的跳转到可视化查询。 |
可视化查询 | 可视化展示该指标的时间趋势图,可查看该指标随时间的变化趋势。 | |
自动异常检测 | 自动检测可能的基础组件和服务异常,无需您干预即可检测出系统风险点,帮助您及时消除隐患,快速定位和排查线上问题。 | |
事件中心 | 展示watchdog事件,可以针对事件配置告警通知。 | |
错误分析 | 收集服务中出现的异常/错误信息,进行聚合分类,用于帮助您分析服务中的各类错误。 | |
报警任务 | 用于新增、管理报警任务。报警任务检测指标值或watchdog事件,满足条件时发送报警消息,通知运维人员及时处理,帮助运维人员快速定位和排查线上问题。 | |
报警历史 | 记录告警历史,可用于查看历史告警记录。 | |
平台管理配置 | 接收组管理 | 管理告警接收组。 |
参数配置 | 用于调整平台各类参数配置。 |
您可以参考如下接入流程图,初步了解如何接入服务端监控。详细接入流程可参考如何接入服务端监控。
服务端监控还开放了报警管理、报警组管理和指标查询等相关业务的OpenAPI。详情请参见API概览。