本文介绍表格数据库 HBase 版实例中监控告警支持的指标项及相关说明。
云监控默认每 30 秒 获取一次数据,但会根据查看监控数据时选择的查询时间范围,将获取的数据根据不同的周期和方式进行聚合展示,具体规则请参见查看云产品监控数据。
当前最多支持查看最近 15 天内的监控数据详情。查看监控数据的方法,请参见查看监控数据。
监控指标表中的单位均为基础单位,各监控的具体单位请以控制台为准。控制台上展示的单位会根据监控数值按照一定的换算标准灵活调整,其中:
多可用区实例不支持以下监控指标,具体支持情况请以控制台实际显示为准。
您可以调用 GetMetricData 接口查询表格数据库 HBase 版实例的各监控指标数据。调用该接口进行查询时,需要获取以下监控指标的相关信息:
Namespace:待查询的监控指标所属的产品空间。
HBase 实例的产品空间名称为 VCM_HBase
。
SubNamespace:待查询的指标所属的维度。
HBase 实例支持查看 Cluster
(实例)、 RegionServer
、Table
3 种维度的监控指标。
MetricName:待查询的监控指标名称。
HBase 实例各监控指标对应的 MetricName 如下表所示,更多详情请参见云监控指标查询。
监控指标名称 | MetricName | 单位 | 说明 |
---|---|---|---|
CPU使用率 | ClusterCpuUtil | % | 实例中所有 Master 和 Region Server 的平均 CPU 使用率。 |
内存使用率 | ClusterMemUtil | % | 实例中所有 Master 和 Region Server 的平均内存使用率。 |
网络输出速率 | ClusterNetworkTransmitThroughput | Byte/s | 实例中所有 Region Server 的网络输出速率之和。 |
网络输入速率 | ClusterNetworkReceiveThroughput | Byte/s | 实例中所有 Region Server 的网络输入速率之和。 |
QPS | ClusterQps | Count/s | 实例中所有 Region Server 的 QPS 之和。 |
TPS | ClusterTps | Count/s | 实例中所有 Region Server 的 TPS 之和。 |
存储(热存)使用情况 | ClusterSpaceQuotaUsage | B | 实例存储空间(热存)的实时使用量。 |
存储(热存)水位 | ClusterSpaceUsagePercent | % | 实例已使用热存空间与总热存空间的实时百分比。 |
Thrift请求平均响应时间 | ThriftCallMeanTime | μs | 实例服务端接收到 Thrift 请求到响应的平均时间。 |
Thrift请求最大响应时间 | ThriftCallMaxTime | μs | 实例服务端接收到 Thrift 请求到响应的最大时间。 |
存储(冷存)使用量 | ClusterColdSpaceQuotaUsage | B | 实例容量型存储空间(冷存)的实时使用量。 |
存储(冷存)水位 | ClusterColdSpaceQuotaUsagePercent | % | 实例已使用容量型存储(冷存)空间与总容量型存储空间的实时百分比。 |
Thrift 请求P99响应时间 | ThriftCallP99Time | μs | ThriftServer 接收到 Thrift 请求到响应时间的 P99 值。 |
监控指标名称 | MetricName | 单位 | 说明 |
---|---|---|---|
CPU使用率 | CpuUtil | % | Region Server 的 CPU 使用率。 |
内存使用率 | MemUtil | % | Region Server 的内存使用率。 |
网络输出速率 | NetworkTransmitThroughput | Byte/s | Region Server 的网络输出速率。 |
网络输入速率 | NetworkReceiveThroughput | Byte/s | Region Server 的网络输入速率。 |
QPS | Qps | Count/s | Region Server 的 QPS。 |
TPS | Tps | Count/s | Region Server 的 TPS。 |
RPC请求队列长度 | RpcRequestQueueLength | Count | Region Server 中 RPC 请求队列中等待处理的请求数量。 |
Compaction队列长度 | CompactionQueueLength | Count | Region Server 中等待执行的 Compaction 任务的数量。 |
Flush队列长度 | FlushQueueLength | Count | Region Server 中等待执行的 Flush 任务的数量。 |
Region数量 | RegionCount | Count | Region Server 持有的 Region 数量。 |
Get请求平均耗时 | AvgGetRt | μs | Region Server 处理 Get 请求的平均耗时,不包括等待时间。 |
BlockCache 命中率 | BlockCacheHitRate | % | Region Server 的读请求命中 BlockCache 的比率。 |
Put请求平均耗时 | AvgPutRt | μs | Region Server 处理 Put 请求的平均耗时,不包括等待时间。 |
Scan请求平均耗时 | AvgScanRT | μs | Region Server 处理 Scan 请求的平均耗时,不包括等待时间。 |
BatchPut请求平均耗时 | AvgBatchPutRt | μs | Region Server 处理 BatchPut 请求的平均耗时,不包括等待时间。 |
RPC请求平均响应时间 | AvgRpcCallRt | μs | Region Server 中 RPC 请求平均响应时间,包括请求等待时间、处理时间等。 |
RPC请求最大响应时间 | MaxRpcCallRT | μs | Region Server 中 RPC 请求最大响应时间,包括请求等待时间、处理时间等。 |
RPC 请求P99响应时间 | P99RpcCallRt | μs | Region Server 中 RPC 请求到响应时间的 P99 值。 |
Get请求P99耗时 | P99GetRt | μs | Region Server 处理 Get 请求的 P99 值,不包括队列等待时间。 |
Put请求P99耗时 | P99PutRt | μs | Region Server 处理 Put 请求的 P99 值,不包括队列等待时间。 |
Scan请求P99耗时 | P99ScanRT | μs | Region Server 处理 Scan 请求的 P99 值,不包括队列等待时间。 |
BatchPut请求P99耗时 | P99BatchPutRt | μs | Region Server 处理 BatchPut 请求的 P99 值,不包括队列等待时间。 |
监控指标名称 | MetricName | 单位 | 说明 |
---|---|---|---|
QPS | TablesReadRequestCount | Count/s | 统计表的 QPS。 |
TPS | TableWriteRequestCount | Count/s | 统计表的 TPS。 |
读请求平均响应时间 | rpcReadCallTotalTimeMean | μs | 统计表的所有读请求的平均响应时间。 |
读请求最大响应时间 | rpcReadCallTotalTimeMax | μs | 统计表的所有读请求的最大响应时间。 |
写请求平均响应时间 | rpcWriteCallTotalTimeMean | μs | 统计表的所有写请求的平均响应时间。 |
写请求最大响应时间 | rpcWriteCallTotalTimeMax | μs | 统计表的所有写请求的最大响应时间。 |
热存空间使用量 | HotStorageSpaceUsage | B | 统计表的存储空间(热存)实时使用量。 |
冷存空间使用量 | ColdStorageSpaceUsage | B | 统计表的容量型存储空间(冷存)的实时使用量。 |