You need to enable JavaScript to run this app.
导航
基础观测概述
最近更新时间:2024.07.16 15:53:19首次发布时间:2023.08.29 22:38:12

容器服务支持通过云原生观测方案,实现集群、基础资源和应用指标(Metrics)的采集、监控和告警。

基本原理

基础观测基于火山引擎托管 Prometheus 服务,兼容开源 Prometheus 的接口以及社区 Exporter 生态,能够快速实现集群基础资源和用户业务的监控。

与自建 Prometheus 环境相比,您无需手工下载、配置 Prometheus 环境,无需考虑维护海量数据的存储成本,提供免搭建、免运维的 Prometheus 集成环境,减少开发及运维成本。
alt

主要特性

云原生基础观测的主要特性,如下表所示。

分类特性基础观测
安装部署采集组件prometheus-agent 组件。
高可用性非托管组件,组件支持分片、自动扩缩容。
数据存储基于托管 Prometheus 实现数据存储,支持不同规格的工作区,详情参见 工作区规格

监控对象

集群监控

集群基础资源、自定义应用监控。包括:

  • 基础资源:包括集群、节点、工作负载、容器组、容器、存储卷等。
  • 控制面组件:包括 kube-apiserver、kube-scheduler、etcd 等。
  • 其他资源:包括 GPU、P2P 镜像加速、Nydus、RDMA 等。

自定义监控

  • 支持自定义云原生应用监控。
  • 支持通过 Prometheus SDK 暴露应用指标,实现应用监控。

自建 Exporter 监控

  • 支持 Prometheus 开源社区提供多种类型的 Exporter,用于采集各种不同服务的指标。包括:数据库、硬件、消息中间件、存储系统、HTTP 服务器等。
  • 支持基于 Prometheus 开源社区提供的 Client Library 创建自定义的 Exporter。Prometheus 社区官方提供了对 Go、Java、Python、Ruby 等语言的支持。
指标查看预置大盘支持,种类丰富。
自定义大盘支持,基于开源 Grafana 搭建。
指标查询支持通过 Explore 查询指标。
告警中心指标告警支持。
告警分级支持。
告警模版支持。
告警静默支持。
告警通知方式邮箱、电话、Webhook、飞书、钉钉、企业微信等。