当您在火山引擎控制台上购买并创建 ECS 实例时,构建实例的公共镜像中已内置了系统监控组件cloud-monitor-agent
,实现对 ECS 实例进行监控,本文介绍云服务器的常见查询指标。
CPU
类别 | 指标名称 | 指标单位 | 指标含义 |
---|
CPU 利用率 | CpuTotal | % | CPU 总利用率。 |
DDHInstanceCpuTotal | % | 专有宿主机实例 CPU 利用率。 |
CPU 使用负载 | LoadPerCore15m | - | 单核 15 分钟平均负载。 |
LoadPerCore1m | - | 单核 1 分钟平均负载。 |
LoadPerCore5m | - | 单核 5 分钟平均负载。 |
内存
类别 | 指标名称 | 指标单位 | 指标含义 |
---|
内存 | MemoryUsedSpace | Bytes | 已用内存。 |
MemoryUsedUtilization | % | 已用内存利用率。 |
存储
类别 | 指标名称 | 指标单位 | 指标含义 |
---|
存储 | DiskInodesUsedPercent | % | 磁盘 inode 利用率。 |
DiskReadBytes | Bytes/s | 磁盘每秒读取字节数。 |
DiskReadIops | - | 磁盘每秒读取的 IOPS 数。 |
DiskTotal | Bytes | 磁盘总容量。 |
DiskUsageAvail | Bytes | 磁盘可用容量。 |
DiskUsageUtilization | % | 磁盘利用率。 |
DiskUsed | Bytes | 磁盘已用容量。 |
DiskWriteBytes | Bytes/s | 磁盘每秒写入字节数。 |
DiskWriteIops | - | 磁盘每秒写入 IOPS 数。 |
网络
类别 | 指标名称 | 指标单位 | 指标含义 |
---|
整机网卡 | NetworkInDrop | - | 网络流入丢弃数。 |
NetworkInErrorPackages | - | 网络流入错误包数。 |
NetworkInPackages | Packet/s | 网络流入包速率。 |
NetworkInRate | Bits/s | 网络流入速率。 |
NetworkOutDrop | - | 网络流出丢弃数。 |
NetworkOutErrorPackages | - | 网络流出错误包数。 |
NetworkOutPackages | - | 网络流出包数。 |
NetworkOutRate | Bits/s | 网络流出速率。 |
EthMTU | - | 网卡 MTU。 |
传输层(TCP/UDP) | NetTcpConnection | - | TCP 连接数。 |
NetTcpConnectionStatus | - | 不同 TCP 连接状态的连接数。 |
TCPInSegs | Packet | 每分钟收到的 TCP 包数量。 |
TCPOutSegs | Packet | 每分钟发送的 TCP 包数量。 |
进程
类别 | 指标名称 | 指标单位 | 指标含义 |
---|
进程 | ProcessCPUPct | % | 进程 CPU 利用率。 |
ProcessChildMajorPgFaults | - | 进程 Child Major Page Faults。 |
ProcessChildMinorPgFaults | - | 进程 Child Minor Page Faults。 |
ProcessIOReadBytes | Bytes | 进程读取的字节数。 |
ProcessIOReadCount | - | 进程读取磁盘次数。 |
ProcessIOWriteBytes | Bytes | 进程写入的字节数。 |
ProcessIOWriteCount | - | 进程写入磁盘次数。 |
ProcessInvoluntaryCtxSwitches | - | 进程被动上下文切换次数。 |
ProcessVoluntaryCtxSwitches | - | 进程主动上下文切换次数。 |
ProcessMajorPgFaults | - | 进程 Major Page Faults。 |
ProcessMemPct | % | 进程内存利用率。 |
ProcessMemRSS(KB) | KB | 进程内存驻留集大小。 |
ProcessMemVMS(KB) | KB | 进程虚拟内存大小。 |
ProcessMinorPageFaults | - | 进程 Minor Page Faults。 |
ProcessOpenFds | - | 进程打开文件数。 |
ProcessThreads | - | 进程使用的线程数。 |
NumDiskSleepProc | - | D 进程数量。 |
NumZombieProc | - | Z 进程数量。 |
GPU
类别 | 指标名称 | 指标单位 | 指标含义 |
---|
GPU | GpuUsedUtilization | % | GPU 利用率。 |
GpuTemperature | ℃ | GPU 温度。 |
GpuPowerReadingsPowerDraw | W | GPU 功率。 |
GpuDecoderUtilization | % | GPU 解码器利用率。 |
GpuEncoderUtilization | % | GPU 编码器利用率。 |
GpuMemoryFreeSpace | Bytes | GPU 空闲内存量。 |
GpuMemoryFreeUtilization | % | GPU 内存空闲率。 |
GpuMemoryTotalSpace | Bytes | GPU 内存总量。 |
GpuMemoryUsedSpace | Bytes | GPU 内存使用量。 |
RDMA
类别 | 指标名称 | 指标单位 | 指标含义 |
---|
RDMA | port_RdmaRxBits | Bits/s | RDMA 网络接收吞吐。 |
port_RdmaTxBits | Bits/s | RDMA 网络发送吞吐。 |
port_RdmaRxPackets | Packet/s | RDMA 网络接收包数量。 |
port_RdmaTxPackets | Packet/s | RDMA 网络发送包数量。 |
Port_RxCnpHandledPackets | - | (接收方向)RDMA 网络 60s 内网卡处理的 CNP 报文数量。 |
Port_RxEcnReceivedPackets | - | (接收方向)RDMA 网络 60s 内网卡收到的 ECN 标记报文数量。 |
Port_RxCnpIgnoredPackets | - | (接收方向)RDMA 网络 60s 内网卡忽略的 CNP 报文数量。 |
Port_TxCnpSendPackets | - | (发送方向)RDMA 网络 60s 内网卡发出的 CNP 报文数量。 |
Port_TxAckTimeoutTimes | - | RDMA 发送端超时次数。 |
Port_RxOutOfSequenceTimes | - | RDMA 接收端乱序次数。 |
Port_TxOutOfSequenceTimes | - | RDMA 发送端乱序次数。 |
Port_ReadRespOutOfSequenceTimes | - | RDMA 网络 Read Response 乱序次数。 |