边缘智能通过火山引擎云监控服务,为您提供针对产品数据指标和产品特定事件的监控与告警服务。本文介绍了边缘智能数据监控与告警的相关配置。
通过火山引擎云监控服务,您可以执行以下与边缘智能数据监控相关的操作:
边缘智能提供以项目为维度的监控报表。您可以通过云监控的 云产品监控 页面,查询边缘智能的项目监控报表。项目监控报表包含 3 部分:节点监控报表、工作负载(应用)监控报表、推理服务监控报表、数据流监控报表。
注意
自定义的时间必须在近 15 天范围内。
说明
监控报表支持 图表联动 功能。开启该功能后,如果您将光标放置在一个图表上,可以同时查看所有图表在特定时刻的数据(如下图所示)。
报表类型 | 支持的图表及数据 | 说明 |
---|---|---|
节点 | CPU使用率 | 节点 CPU 使用率(%)的变化趋势。 |
内存使用率 | 节点内存使用率(%)的变化趋势。 | |
磁盘吞吐 | 节点磁盘吞吐量(bit/s)的变化趋势。 | |
网络IO | 节点网卡上行/下行带宽(bit/s)的变化趋势。 | |
流量统计 | 节点网卡传输流量(Byte)的变化趋势。 | |
温度 | 节点主板温度(℃)的变化趋势。 | |
磁盘总量 | 节点磁盘大小(Byte)的变化趋势。 | |
磁盘使用率 | 节点磁盘使用率(%)的变化趋势。 | |
工作负载 | CPU用量 | 工作负载占用的 CPU 核数(Core)的变化趋势。 |
CPU配额 | 工作负载被分配的 CPU 配额(Core)的变化趋势。 | |
CPU限额 | 工作负载被分配的 CPU 限额(Core)的变化趋势。 | |
内存用量 | 工作负载占用的内存(Byte)的变化趋势。 | |
内存配额 | 工作负载被分配的内存配额(Byte)的变化趋势。 | |
内存限额 | 工作负载被分配的内存限额(Byte)的变化趋势。 | |
推理服务 | GPU使用率 | 模型服务 GPU 使用率(%)的变化趋势。 |
QPS | 模型服务 QPS 的变化趋势。 | |
GPU显存占用 | 模型服务占用的 GPU 显存(GB)的变化趋势。 | |
总耗时 | 模型服务的请求平均耗时(ms)的变化趋势。 | |
队列调度耗时 | 模型服务请求队列调度过程的平均耗时(ms)的变化趋势。 | |
输入耗时 | 模型服务输入处理过程的平均耗时(ms)的变化趋势。 | |
输出耗时 | 模型服务输出处理过程的平均耗时(ms)的变化趋势。 | |
模型计算耗时 | 模型服务计算过程的平均耗时(ms)的变化趋势。 | |
数据流 | 视频流fps | 适用于视频数据流实例,表示一个视频数据流实例每秒传输的图片帧数。 |
source入流量 | 适用于时序数据流实例的 SQL 执行过程算子,表示一个 SQL 执行过程算子读入的消息总量,即算子运行时处理了多少消息。 | |
sink出流量 | 适用于时序数据流实例的 SQL 执行过程算子,表示一个 SQL 执行过程算子 |
当您在云监控中配置了针对边缘智能数据指标的告警策略后,云监控将为您监控对应数据指标的数值变化,并在指标数值满足一定特征时向您发送告警。
告警策略只适用于已经开启 负载水位 开关的节点。
您可以在云监控控制台的告警中心创建告警策略。具体操作,请参见云监控产品文档。
创建告警策略过程中,留意以下配置:
名称:为告警策略设置一个名称。建议在名称中包含“边缘智能”,以便于查找。
示例:边缘智能节点告警策略。
资源类型:选择 CDN与加速 > 边缘计算-边缘智能。
维度:表示监控对象的类型。支持的选项包含 节点、工作负载、推理服务、节点磁盘、节点网络、节点温度
资源:表示要监控的资源的范围。
您选择的 维度 不同,支持使用的资源筛选器有差异。具体如下表所示。
维度 | 资源筛选器 |
---|---|
节点 | 边缘智能项目、节点名称 |
工作负载 | 边缘智能项目、prod名称 |
推理服务 | 边缘智能项目、推理服务ID |
节点磁盘 | 边缘智能项目、节点ID、磁盘名称 |
节点网络 | 边缘智能项目、节点ID、网卡名称 |
节点温度 | 边缘智能项目、节点ID、温度传感器 |
每个资源筛选器的选项包含 全部、部分。
触发条件:定义告警的触发条件。您选择的 维度 不同,触发条件中支持使用的数据指标有差异。
示例:当 维度 是 节点磁盘 时,触发条件中允许使用 磁盘吞吐 和 磁盘使用率 指标。
与边缘智能相关的所有数据监控指标,请参见云监控指标查询。
当您在云监控中配置了针对边缘智能事件的事件规则后,云监控将为您监控和记录对应事件,并在事件发生时向您发送通知。
事件规则只适用于已经开启 负载水位 开关的节点。
您可以在云监控控制台的事件中心创建事件规则。具体操作,请参见云监控产品文档。
创建事件规则过程中,留意以下配置: