You need to enable JavaScript to run this app.
导航
如何处理ECS实例的“Cloud-monitor-agent无法采集监控数据”问题
最近更新时间:2024.10.11 10:08:41首次发布时间:2023.03.13 13:59:35

本文介绍如何排查、处理云监控插件导致的云服务器实例监控信息无法查看问题。

操作场景

由于未安装云监控插件、插件异常或插件版本较低,导致云服务器实例监控指标缺失时,您可根据本文指引排查处理,恢复指标正常展示。

问题确认

  1. 登录故障的云服务器实例,详情可查看登录实例

  2. 在实例中执行如下命令,确认实例是否已安装云监控插件。

    systemctl list-units --type=service
    

故障排查

操作系统监控缺失

若您的操作系统监控指标存在异常或缺失,请按本节内容排查。

  1. 登录故障的云服务器实例,详情可查看登录实例
  2. 在实例中执行如下命令,查看云监控插件运行状态。
    systemctl status cloud-monitor-agent   
    
    • 若云监控插件服务处于active(running)(正常运行)状态,如下图所示,请提交工单获取技术支持。

    • 若插件未处于active(running)(正常运行)状态,如下图所示。

      执行如下命令,更新云监控插件。

      #其他地域
      VERSION=v3.20.0.fix.1 bash -x /usr/local/cloud-monitor-agent/install.sh
      
      #柔佛地域
      VERSION=v3.18.0.fix.11 bash -x /usr/local/cloud-monitor-agent/install.sh
      
      
  3. 按如下步骤确认修复结果。
    1. 执行如下命令,确认云监控插件为active(running) 状态。
    systemctl status cloud-monitor-agent   
    
    1. 登录云服务器控制台,确认故障实例缺失的指标已正常展示。
    2. 若1、2两步中任意一项仍未恢复正常,请提交工单获取技术支持。

TCP连接监控缺失

若您的TCP连接监控指标存在异常或缺失,请按本节内容排查。

注意

开启TCP连接监控后,将对实例TCP带宽性能有一定影响。

  1. 确认实例使用的镜像支持查看TCP连接监控指标,支持的镜像列表可查看使用说明

  2. 若实例的镜像支持查看,请继续按如下步骤排查。

  3. 登录故障的云服务器实例,详情可查看登录实例

  4. 在实例中执行如下命令,安装云监控插件。

    安装插件时,将自动执行systemctl daemon-reload命令。此时,请勿在实例中执行可能导致冲突的操作,避免影响您的业务正常运行。

    #其他地域
     	VERSION=v3.20.0.fix.1 bash -x /usr/local/cloud-monitor-agent/install.sh
     	
     #柔佛地域
     VERSION=v3.18.0.fix.11 bash -x /usr/local/cloud-monitor-agent/install.sh
     	
    
  5. 执行如下命令,查看云监控插件服务是否正常运行。

    systemctl status cloud-monitor-agent
    

    正常运行示例如下:

  6. 执行如下命令,开启TCP连接服务。

    sed -i 's/EBPF: true/EBPF: false/' /usr/local/cloud-monitor-agent/config.yaml
    
  7. 执行如下命令,重启云监控插件服务。

    systemctl restart cloud-monitor-agent
    
  8. 所有步骤执行成功后,需等待几分钟。若指标仍缺失,请提交工单获取技术支持。

进程监控指标缺失

若仅进程监控下的“接收发送网络字节数”、“接收发送网络包数量”指标缺失,请确认:

  • TCP连接存活时间大于30s,且进程执行了网络I/O。
  • 使用流程符合进程监控说明。