You need to enable JavaScript to run this app.
导航
应用场景
最近更新时间:2024.08.26 19:46:24首次发布时间:2022.04.21 21:40:14

火山引擎托管 Prometheus 允许用户快速创建云端托管的标准 Prometheus 服务,为用户省去 Prometheus 的管理和维护工作,轻松满足对 Kubernetes 集群监控和自定义等监控场景。

容器服务观测

托管 Prometheus 支持与容器服务 VKE 深度集成,覆盖全面的 Kubernetes 容器集群监控场景。并基于 kubelet-cadvisor、node-exporter、kube-state-metrics 等组件,实现集群、节点、组件、容器、应用、网络等多维度的监控。

Kubernetes 云原生集群监控包括多种类型的资源、组件和对象,如下表所示。

监控对象对应组件说明
节点node-exporter节点的运行指标,包括节点的 CPU、内存、文件系统、网络等基础监控指标。
容器kubelet-cadvisor容器的运行统计信息,例如 CPU、内存、网络吞吐等性能指标。
KubeletkubeletKubelet 性能指标,例如 HTTP 请求数、HTTP 请求耗时、节点配置错误等。
Kubernetes 资源kube-state-metricsKubernetes 资源对象的状态指标,例如 Pod 重启、节点状态异常等。
NVIDIA GPU 显卡nvidia-device-pluginNVIDIA GPU 显卡的性能指标,例如温度、功率、利用率、Xid 等。
共享 GPU 显卡mgpu共享 GPU 显卡的性能指标,例如 Pod 的显存利用率、显存利用量等。
RDMA 网络rdma-device-pluginRDMA 网络性能指标,包括吞吐、拥塞、重传乱序等指标。
Ingress-nginx 组件ingress-nginxIngress-nginx 组件的性能指标,例如请求数、请求处理延时、配置重载次数等。
P2P 镜像加速功能p2p-acceleratorP2P 镜像加速的性能指标,例如代理请求数、镜像加速任务数等。
镜像加速功能image-accelerator镜像启动加速的性能指标。

alt

开源生态观测

托管 Prometheus 服务拥有良好的开源亲和性,支持基于社区开源的第三方 Exporter,面向开源生态(中间件、数据库等)进行指标观测。主要特点如下:

  • 开源社区兼容:支持 Prometheus 社区中提供的 SDK,直接进行业务埋点开发,方便快速对接
  • 云原生兼容:对于云原生应用,无需修改和适配,支持直接采集指标,实现观测
  • Exporter 兼容:支持开源社区提供多种类型的 Exporter,快速实现传统应用的指标采集

alt

自定义业务观测

在自定义业务监控场景下,允许用户自定义需要上报的监控指标。例如:订单交易量、用户活跃度等。同时,结合容器指标、中间件指标等,可以全链路完成业务的观测和监控。主要特点如下:

  • 业务平台兼容:支持容器服务集群和云服务器实例中的业务监控
  • 多类型服务发现:支持多种类型的服务发现形式,允许对业务相关资源进行筛选和观测
  • 多语言 SDK:兼容社区提供的多种语言 SDK,助力快速开发

alt

云服务观测

云监控集成

云监控是火山引擎云上一站式监控告警解决方案。可以帮助您收集并可视化展示火山引擎上多种类型云产品的资源状态和监控信息,包括:云服务器、集群、网关、专线连接、云存储等。详情请参见 什么是云监控

您可以通过将云监控接入托管 Prometheus,与您集群中的业务监控数据进行汇聚,实现业务数据和基础资源数据的统一监控。同时,还可以借助托管 Prometheus 与 Grafana 的天然兼容性,使用 Grafana 搭建业务相关的大盘。
alt

云产品自监控

部分云产品提供了自身监控的 exporter 和指标集,但这些云产品的指标及看板散落在各自的控制台。为了能将这些数据进行统一采集和展示,托管 Prometheus 支持通过部署 exporter 并接入的方式,提供更加便捷、一致的日常运维监控能力。

  • 已通过产品化,完成托管 Prometheus 接入的云产品有:容器服务(VKE)、云服务器(ECS)、微服务引擎(MSE)、API 网关(APIG)、弹性容器实例(VCI)等。这些产品的接入方式,请参见 云服务接入
  • 未产品化,但可以通过自监控 exporter 接入的云产品有:veImageX、视频点播等。详情请参见 监控 veImageX 云服务

alt