You need to enable JavaScript to run this app.
导航
监控指标说明
最近更新时间:2024.10.12 16:22:15首次发布时间:2022.05.11 14:00:33

本文介绍表格数据库 HBase 版实例中监控告警支持的指标项及相关说明。

注意事项

  • 云监控默认每 30 秒 获取一次数据,但会根据查看监控数据时选择的查询时间范围,将获取的数据根据不同的周期和方式进行聚合展示,具体规则请参见查看云产品监控数据

  • 当前最多支持查看最近 15 天内的监控数据详情。查看监控数据的方法,请参见查看监控数据

  • 监控指标表中的单位均为基础单位,各监控的具体单位请以控制台为准。控制台上展示的单位会根据监控数值按照一定的换算标准灵活调整,其中:

    • SI:按照 SI 标准,将 1000 作为词头进行单位换算,换算时会在基础单位前增加 K、M、G 等词头。例如,网络输出速率的基础单位为 B/s,若网络输出速率的监控数值较大,控制台上的单位可能会调整为 KB/s、MB/s、GB/s 等。
    • IEC:按照 IEC 标准,将 1024 作为词头进行单位换算。例如,存储(热存)使用情况的基础单位为 B,若存储已使用容量数值较大,控制台上的单位可能会调整为 KiB、MiB、GiB 等。
  • 多可用区实例不支持以下监控指标,具体支持情况请以控制台实际显示为准。

    • Table 级别的监控指标。
    • Thrift 相关监控指标。
    • 实例和 Region Server 级别的 CPU 使用率和内存使用率。

监控指标说明

您可以调用 GetMetricData 接口查询表格数据库 HBase 版实例的各监控指标数据。调用该接口进行查询时,需要获取以下监控指标的相关信息:

  • Namespace:待查询的监控指标所属的产品空间。
    HBase 实例的产品空间名称为 VCM_HBase

  • SubNamespace:待查询的指标所属的维度。
    HBase 实例支持查看 Cluster(实例)、 RegionServerTable 3 种维度的监控指标。

  • MetricName:待查询的监控指标名称。
    HBase 实例各监控指标对应的 MetricName 如下表所示,更多详情请参见云监控指标查询

实例监控指标

监控指标名称MetricName单位说明
CPU使用率ClusterCpuUtil%实例中所有 Master 和 Region Server 的平均 CPU 使用率。
内存使用率ClusterMemUtil%实例中所有 Master 和 Region Server 的平均内存使用率。
网络输出速率ClusterNetworkTransmitThroughputByte/s实例中所有 Region Server 的网络输出速率之和。
网络输入速率ClusterNetworkReceiveThroughputByte/s实例中所有 Region Server 的网络输入速率之和。
QPSClusterQpsCount/s实例中所有 Region Server 的 QPS 之和。
TPSClusterTpsCount/s实例中所有 Region Server 的 TPS 之和。
存储(热存)使用情况ClusterSpaceQuotaUsageB实例存储空间(热存)的实时使用量。
存储(热存)水位ClusterSpaceUsagePercent%实例已使用热存空间与总热存空间的实时百分比。
Thrift请求平均响应时间ThriftCallMeanTimeμs实例服务端接收到 Thrift 请求到响应的平均时间。
Thrift请求最大响应时间ThriftCallMaxTimeμs实例服务端接收到 Thrift 请求到响应的最大时间。
存储(冷存)使用量ClusterColdSpaceQuotaUsageB实例容量型存储空间(冷存)的实时使用量。
存储(冷存)水位ClusterColdSpaceQuotaUsagePercent%实例已使用容量型存储(冷存)空间与总容量型存储空间的实时百分比。
Thrift 请求P99响应时间ThriftCallP99TimeμsThriftServer 接收到 Thrift 请求到响应时间的 P99 值。

Region Server 监控指标

监控指标名称MetricName单位说明
CPU使用率CpuUtil%Region Server 的 CPU 使用率。
内存使用率MemUtil%Region Server 的内存使用率。
网络输出速率NetworkTransmitThroughputByte/sRegion Server 的网络输出速率。
网络输入速率NetworkReceiveThroughputByte/sRegion Server 的网络输入速率。
QPSQpsCount/sRegion Server 的 QPS。
TPSTpsCount/sRegion Server 的 TPS。
RPC请求队列长度RpcRequestQueueLengthCountRegion Server 中 RPC 请求队列中等待处理的请求数量。
Compaction队列长度CompactionQueueLengthCountRegion Server 中等待执行的 Compaction 任务的数量。
Flush队列长度FlushQueueLengthCountRegion Server 中等待执行的 Flush 任务的数量。
Region数量RegionCountCountRegion Server 持有的 Region 数量。
Get请求平均耗时AvgGetRtμsRegion Server 处理 Get 请求的平均耗时,不包括等待时间。
BlockCache 命中率BlockCacheHitRate%Region Server 的读请求命中 BlockCache 的比率。
Put请求平均耗时AvgPutRtμsRegion Server 处理 Put 请求的平均耗时,不包括等待时间。
Scan请求平均耗时AvgScanRTμsRegion Server 处理 Scan 请求的平均耗时,不包括等待时间。
BatchPut请求平均耗时AvgBatchPutRtμsRegion Server 处理 BatchPut 请求的平均耗时,不包括等待时间。
RPC请求平均响应时间AvgRpcCallRtμsRegion Server 中 RPC 请求平均响应时间,包括请求等待时间、处理时间等。
RPC请求最大响应时间MaxRpcCallRTμsRegion Server 中 RPC 请求最大响应时间,包括请求等待时间、处理时间等。
RPC 请求P99响应时间P99RpcCallRtμsRegion Server 中 RPC 请求到响应时间的 P99 值。
Get请求P99耗时P99GetRtμsRegion Server 处理 Get 请求的 P99 值,不包括队列等待时间。
Put请求P99耗时P99PutRtμsRegion Server 处理 Put 请求的 P99 值,不包括队列等待时间。
Scan请求P99耗时P99ScanRTμsRegion Server 处理 Scan 请求的 P99 值,不包括队列等待时间。
BatchPut请求P99耗时P99BatchPutRtμsRegion Server 处理 BatchPut 请求的 P99 值,不包括队列等待时间。

Table 监控指标

监控指标名称MetricName单位说明
QPSTablesReadRequestCountCount/s统计表的 QPS。
TPSTableWriteRequestCountCount/s统计表的 TPS。
读请求平均响应时间rpcReadCallTotalTimeMeanμs统计表的所有读请求的平均响应时间。
读请求最大响应时间rpcReadCallTotalTimeMaxμs统计表的所有读请求的最大响应时间。
写请求平均响应时间rpcWriteCallTotalTimeMeanμs统计表的所有写请求的平均响应时间。
写请求最大响应时间rpcWriteCallTotalTimeMaxμs统计表的所有写请求的最大响应时间。
热存空间使用量HotStorageSpaceUsageB统计表的存储空间(热存)实时使用量。
冷存空间使用量ColdStorageSpaceUsageB统计表的容量型存储空间(冷存)的实时使用量。