本文为您介绍Yarn指标的详细信息。
Yarn指标包含以下部分:
纬度 | 监控指标名称 | 单位 |
---|---|---|
节点个数 | 当前存活的 NodeManager 个数 | 个 |
当前 Decommissioned 的 NodeManager 个数 | 个 | |
当前NumDecommissioningNMs 的 NodeManager 个数 | 个 | |
当前 Lost 的 NodeManager 个数 | 个 | |
当前 Unhealthy 的 NodeManager 个数 | 个 | |
Memory | 集群中已分配的内存资源 | MB |
集群中可使用的内存资源 | MB | |
集群中保留的内存资源 | MB | |
集群中全部的内存资源 | MB | |
Applications | 采样周期内集群中运行完成的作业数 | 个 |
采样周期内集群中运行失败的作业数 | 个 | |
采样周期内集群中被杀掉的作业数 | 个 | |
采样周期内集群中等待运行的作业数 | 个 | |
采样周期内集群中运行中的作业数 | 个 | |
采样周期内集群中已提交的作业数 | 个 | |
Containers | 集群中已分配的 Container 数目 | 个 |
集群中请求中的 Container 数目 | 个 | |
集群中保留的 Container 数目 | 个 | |
内存使用率 | 集群当前内存资源的使用率 | % |
Cores | 集群中已分配的 CPU 资源 | 个 |
集群中可使用的 CPU 资源 | 个 | |
集群中保留的 CPU 资源 | 个 | |
集群中全部的 CPU 资源 | 个 | |
CPU 使用率 | 集群当前 CPU 资源的使用率 | % |
AM 启动数量 | AM 启动数量 | 个 |
RM 启动 AM 的平均时间 | RM 启动 AM 的平均时间 | ms |
注册的 AM 总数 | 注册的 AM 总数 | 个 |
AM 注册到 RM 的平均时间 | AM 注册到 RM 的平均时间 | ms |
已包含在概览中
纬度 | 监控指标名称 | 单位 |
---|---|---|
CPU 核数 | 当前队列分配的 VCore 个数 | 核 |
当前队列中 reserved 的 VCore 个数 | 核 | |
当前队列可用的 VCore 个数 | 核 | |
当前队列的资源请求中 pending 的 VCore 个数 | 核 | |
应用总数 | 当前队列历史提交作业个数 | 个 |
当前队列正在运行的作业个数 | 个 | |
当前队列 pending 的作业个数 | 个 | |
当前队列完成的作业个数 | 个 | |
当前队列 kill 掉的作业个数 | 个 | |
当前队列失败的作业个数 | 个 | |
当前队列中 active 的作业个数 | 个 | |
当前队列中运行作业运行时间小于60分钟的作业个数 | 个 | |
当前队列中运行作业运行时间介于60~300分钟的作业个数 | 个 | |
当前队列中运行作业运行时间介于300~1440分钟的作业个数 | 个 | |
当前队列中运行作业运行时间大于1440分钟的作业个数 | 个 | |
内存大小 | 当前队列分配的内存大小 | MB |
当前队列可用的内存大小 | MB | |
当前队列的资源请求中 pending 的内存大小 | MB | |
当前队列中 reserved 内存大小 | MB | |
容器个数 | 当前队列分配的 container 个数 | 个 |
当前队列的资源请求中 pending 的 container 个数 | 个 | |
当前队列中 reserved 的 container 个数 | 个 | |
容器分配释放总数 | 当前队列分配的 container 总数 | 个 |
当前队列 release 的 container 总数 | 个 | |
当前队列 preempt 的 container 总数 | 个 | |
用户数 | 当前队列活跃用户数 | 个 |
纬度 | 监控指标名称 | 单位 |
---|---|---|
RPC 认证授权数 | RPC authentication 失败个数 | 个 |
RPC authentication 成功个数 | 个 | |
RPC authorization 失败个数 | 个 | |
RPC authorization 成功个数 | 个 | |
RPC 接收发送数据量 | RPC 接收数据量 | bytes/s |
RPC 发送数据量 | bytes/s | |
RPC 连接数 | 当前打开的连接个数 | 个 |
RPC 请求次数 | RPC 请求次数 | 次 |
RPC Queue 请求次数 | 次 | |
RPC 队列长度 | RPC 当前队列长度 | 个 |
RPC 平均处理时间 | RPC 请求平均处理时间 | s |
RPC 在 Queue 中平均时间 | s | |
GC 次数 | Young GC 次数 | 次 |
Full GC 次数 | 次 | |
GC 时间 | Full GC 消耗时间 | s |
垃圾回收时间消耗 | s | |
Young GC 消耗时间 | s | |
内存区域占比 | Survivor 0区内存使用占比 | % |
Eden 区内存使用占比 | % | |
Compressed class space 区内存使用占比 | % | |
Survivor 1区内存使用占比 | % | |
Old 区内存使用占比 | % | |
Metaspace 区内存使用占比 | % | |
JVM 线程数量 | 处于 NEW 状态的线程数量 | 个 |
处于 RUNNABLE 状态的线程数量 | 个 | |
处于 BLOCKED 状态的线程数量 | 个 | |
处于 WAITING 状态的线程数量 | 个 | |
处于 TIMED WAITING 状态的线程数量 | 个 | |
处于 Terminated 状态的线程数量 | 个 | |
JVM 日志数量 | Fatal 日志数量 | 个 |
Error 日志数量 | 个 | |
Warn 日志数量 | 个 | |
Info 日志数量 | 个 | |
JVM 内存 | 进程使用的非堆内存大小 | MB |
进程 commit 的非堆内存大小 | MB | |
进程使用的堆内存大小 | MB | |
进程 commit 的堆内存大小 | MB | |
进程最大的堆内存大小 | MB | |
进程最大内存大小 | MB | |
CPU 利用率 | CPU 利用率 | % |
CPU 累计使用时间 | CPU 累计使用时间 | ms |
文件描述符数 | 最大文件描述符数 | 个 |
打开文件描述符数 | 个 | |
进程运行时长 | 进程运行时长 | s |
工作线程数 | 进程的 Daemon 线程个数 | 个 |
进程的线程个数 | 个 |
纬度 | 监控指标名称 | 单位 |
---|---|---|
GC 次数 | Young GC 次数 | 次 |
Full GC 次数 | 次 | |
GC 时间 | Full GC 消耗时间 | s |
垃圾回收时间消耗 | s | |
Young GC 消耗时间 | s | |
内存区域占比 | Survivor 0区内存使用占比 | % |
Eden 区内存使用占比 | % | |
Compressed class space 区内存使用占比 | % | |
Survivor 1区内存使用占比 | % | |
Old 区内存使用占比 | % | |
Metaspace 区内存使用占比 | % | |
JVM 线程数量 | 处于 NEW 状态的线程数量 | 个 |
处于 RUNNABLE 状态的线程数量 | 个 | |
处于 BLOCKED 状态的线程数量 | 个 | |
处于 WAITING 状态的线程数量 | 个 | |
处于 TIMED WAITING 状态的线程数量 | 个 | |
当前 TERMINATED 状态线程数量 | 个 | |
JVM 日志数量 | FATAL 级别日志数量 | 个 |
ERROR 级别日志数量 | 个 | |
WARN 级别日志数量 | 个 | |
INFO 级别日志数量 | 个 | |
JVM 内存 | 进程使用的非堆内存大小 | MB |
进程 commit 的非堆内存大小 | MB | |
进程使用的堆内存大小 | MB | |
进程 commit 的堆内存大小 | MB | |
进程最大的堆内存大小 | MB | |
进程最大内存大小 | MB | |
容器总数 | launch 的 container 个数 | 个 |
运行完成的 container 个数 | 个 | |
失败的 container 个数 | 个 | |
被 kill 的 container 个数 | 个 | |
初始化中的 container 个数 | 个 | |
正在运行的 container 个数 | 个 | |
NodeManager 分配的 container 数量 | 个 | |
容器启动平均耗时 | 容器启动平均耗时 | ms |
容器启动操作数 | 容器启动操作数 | 个 |
CPU 核数 | NodeManager 可用的 VCore 个数 | 核 |
NodeManager 分配的 VCore个数 | 核 | |
内存大小 | NodeManager 分配的内存大小 | GB |
NodeManager 可用的内存大小 | GB | |
CPU 利用率 | CPU 利用率 | % |
CPU 累计使用时间 | CPU 累计使用时间 | ms |
文件描述符数 | 最大文件描述符数 | 个 |
打开文件描述符数 | 个 | |
进程运行时长 | 进程运行时长 | s |
工作线程数 | 进程的 Daemon 线程个数 | 个 |
进程的线程个数 | 个 |
标题 | 描述 | 单位 |
---|---|---|
JVM 内存使用 | TimelineServer 非堆空间使用量 | MB |
TimelineServer 非堆空间Committed量 | MB | |
TimelineServer 非堆空间最大值 | MB | |
TimelineServer 堆空间使用量 | MB | |
TimelineServer 堆空间Committed量 | MB | |
TimelineServer 堆空间最大值 | MB | |
TimelineServer 内存最大值 | MB | |
GC 情况 | TimelineServer GC 次数 | count |
TimelineServer GC 耗时 | ms | |
操作频率 | TimelineServer GetEntities 操作频率 | 次/s |
TimelineServer GetEntity 操作频率 | 次/s | |
TimelineServer GetEvents 操作频率 | 次/s | |
TimelineServer PostEntities 操作频率 | 次/s | |
TimelineServer GetDomain 操作频率 | 次/s | |
TimelineServer PutDomain 操作频率 | 次/s | |
TimelineServer GetDomains 操作频率 | 次/s | |
操作平均耗时 | TimelineServer GetEntities 操作平均耗时 | ms |
TimelineServer GetEntity 操作平均耗时 | ms | |
TimelineServer GetEvents 操作平均耗时 | ms | |
TimelineServer PostEntities 操作平均耗时 | ms | |
TimelineServer GetDomain 操作平均耗时 | ms | |
TimelineServer PutDomain 操作平均耗时 | ms | |
TimelineServer GetDomains 操作平均耗时 | ms |