You need to enable JavaScript to run this app.
导航
Yarn 监控指标
最近更新时间:2025.02.08 15:02:36首次发布时间:2023.01.16 19:40:29
我的收藏
有用
有用
无用
无用

本文为您介绍Yarn指标的详细信息。
Yarn指标包含以下部分:

YARN-概览

纬度

监控指标名称

单位

节点个数

当前存活的 NodeManager 个数

当前 Decommissioned 的 NodeManager 个数

当前NumDecommissioningNMs 的 NodeManager 个数

当前 Lost 的 NodeManager 个数

当前 Unhealthy 的 NodeManager 个数

Memory

集群中已分配的内存资源

MB

集群中可使用的内存资源

MB

集群中保留的内存资源

MB

集群中全部的内存资源

MB

Applications

采样周期内集群中运行完成的作业数

采样周期内集群中运行失败的作业数

采样周期内集群中被杀掉的作业数

采样周期内集群中等待运行的作业数

采样周期内集群中运行中的作业数

采样周期内集群中已提交的作业数

Containers

集群中已分配的 Container 数目

集群中请求中的 Container 数目

集群中保留的 Container 数目

内存使用率

集群当前内存资源的使用率

%

Cores

集群中已分配的 CPU 资源

集群中可使用的 CPU 资源

集群中保留的 CPU 资源

集群中全部的 CPU 资源

CPU 使用率

集群当前 CPU 资源的使用率

%

AM 启动数量

AM 启动数量

RM 启动 AM 的平均时间

RM 启动 AM 的平均时间

ms

注册的 AM 总数

注册的 AM 总数

AM 注册到 RM 的平均时间

AM 注册到 RM 的平均时间

ms

YARN-Queues

已包含在概览中

纬度

监控指标名称

单位

CPU 核数

当前队列分配的 VCore 个数

当前队列中 reserved 的 VCore 个数

当前队列可用的 VCore 个数

当前队列的资源请求中 pending 的 VCore 个数

应用总数

当前队列历史提交作业个数

当前队列正在运行的作业个数

当前队列 pending 的作业个数

当前队列完成的作业个数

当前队列 kill 掉的作业个数

当前队列失败的作业个数

当前队列中 active 的作业个数

当前队列中运行作业运行时间小于 60 分钟的作业个数

当前队列中运行作业运行时间介于 60~300 分钟的作业个数

当前队列中运行作业运行时间介于 300~1440 分钟的作业个数

当前队列中运行作业运行时间大于 1440 分钟的作业个数

内存大小

当前队列分配的内存大小

MB

当前队列可用的内存大小

MB

当前队列的资源请求中 pending 的内存大小

MB

当前队列中 reserved 内存大小

MB

容器个数

当前队列分配的 container 个数

当前队列的资源请求中 pending 的 container 个数

当前队列中 reserved 的 container 个数

容器分配释放总数

当前队列分配的 container 总数

当前队列 release 的 container 总数

当前队列 preempt 的 container 总数

用户数

当前队列活跃用户数

YARN-ResourceManager

纬度

监控指标名称

单位

RPC 认证授权数

RPC authentication 失败个数

RPC authentication 成功个数

RPC authorization 失败个数

RPC authorization 成功个数

RPC 接收发送数据量

RPC 接收数据量

bytes/s

RPC 发送数据量

bytes/s

RPC 连接数

当前打开的连接个数

RPC 请求次数

RPC 请求次数

RPC Queue 请求次数

RPC 队列长度

RPC 当前队列长度

RPC 平均处理时间

RPC 请求平均处理时间

s

RPC 在 Queue 中平均时间

s

GC 次数

Young GC 次数

Full GC 次数

GC 时间

Full GC 消耗时间

s

垃圾回收时间消耗

s

Young GC 消耗时间

s

内存区域占比

Survivor 0 区内存使用占比

%

Eden 区内存使用占比

%

Compressed class space 区内存使用占比

%

Survivor 1 区内存使用占比

%

Old 区内存使用占比

%

Metaspace 区内存使用占比

%

JVM 线程数量

处于 NEW 状态的线程数量

处于 RUNNABLE 状态的线程数量

处于 BLOCKED 状态的线程数量

处于 WAITING 状态的线程数量

处于 TIMED WAITING 状态的线程数量

处于 Terminated 状态的线程数量

JVM 日志数量

Fatal 日志数量

Error 日志数量

Warn 日志数量

Info 日志数量

JVM 内存

进程使用的非堆内存大小

MB

进程 commit 的非堆内存大小

MB

进程使用的堆内存大小

MB

进程 commit 的堆内存大小

MB

进程最大的堆内存大小

MB

进程最大内存大小

MB

CPU 利用率

CPU 利用率

%

CPU 累计使用时间

CPU 累计使用时间

ms

文件描述符数

最大文件描述符数

打开文件描述符数

进程运行时长

进程运行时长

s

工作线程数

进程的 Daemon 线程个数

进程的线程个数

YARN-NodeManager

纬度

监控指标名称

单位

GC 次数

Young GC 次数

Full GC 次数

GC 时间

Full GC 消耗时间

s

垃圾回收时间消耗

s

Young GC 消耗时间

s

内存区域占比

Survivor 0 区内存使用占比

%

Eden 区内存使用占比

%

Compressed class space 区内存使用占比

%

Survivor 1 区内存使用占比

%

Old 区内存使用占比

%

Metaspace 区内存使用占比

%

JVM 线程数量

处于 NEW 状态的线程数量

处于 RUNNABLE 状态的线程数量

处于 BLOCKED 状态的线程数量

处于 WAITING 状态的线程数量

处于 TIMED WAITING 状态的线程数量

当前 TERMINATED 状态线程数量

JVM 日志数量

FATAL 级别日志数量

ERROR 级别日志数量

WARN 级别日志数量

INFO 级别日志数量

JVM 内存

进程使用的非堆内存大小

MB

进程 commit 的非堆内存大小

MB

进程使用的堆内存大小

MB

进程 commit 的堆内存大小

MB

进程最大的堆内存大小

MB

进程最大内存大小

MB

容器总数

launch 的 container 个数

运行完成的 container 个数

失败的 container 个数

被 kill 的 container 个数

初始化中的 container 个数

正在运行的 container 个数

NodeManager 分配的 container 数量

容器启动平均耗时

容器启动平均耗时

ms

容器启动操作数

容器启动操作数

CPU 核数

NodeManager 可用的 VCore 个数

NodeManager 分配的 VCore个数

内存大小

NodeManager 分配的内存大小

GB

NodeManager 可用的内存大小

GB

CPU 利用率

CPU 利用率

%

CPU 累计使用时间

CPU 累计使用时间

ms

文件描述符数

最大文件描述符数

打开文件描述符数

进程运行时长

进程运行时长

s

工作线程数

进程的 Daemon 线程个数

进程的线程个数

YARN-TimeLineSever

标题

描述

单位

JVM 内存使用

TimelineServer 非堆空间使用量

MB

TimelineServer 非堆空间Committed量

MB

TimelineServer 非堆空间最大值

MB

TimelineServer 堆空间使用量

MB

TimelineServer 堆空间Committed量

MB

TimelineServer 堆空间最大值

MB

TimelineServer 内存最大值

MB

GC 情况

TimelineServer GC 次数

count

TimelineServer GC 耗时

ms

操作频率

TimelineServer GetEntities 操作频率

次/s

TimelineServer GetEntity 操作频率

次/s

TimelineServer GetEvents 操作频率

次/s

TimelineServer PostEntities 操作频率

次/s

TimelineServer GetDomain 操作频率

次/s

TimelineServer PutDomain 操作频率

次/s

TimelineServer GetDomains 操作频率

次/s

操作平均耗时

TimelineServer GetEntities 操作平均耗时

ms

TimelineServer GetEntity 操作平均耗时

ms

TimelineServer GetEvents 操作平均耗时

ms

TimelineServer PostEntities 操作平均耗时

ms

TimelineServer GetDomain 操作平均耗时

ms

TimelineServer PutDomain 操作平均耗时

ms

TimelineServer GetDomains 操作平均耗时

ms