日志服务提供一站式的监控告警功能。日志服务告警支持数据实时监控、告警策略与告警渠道管理,适用于运维场景。
功能介绍
说明
日志服务告警功能目前为公测状态,暂不收取短信通知、语音通知等任何服务费用。告警功能公测期的结束时间及计费策略请关注后续产品公告。
在企业级运维场景下,海量日志数据被采集并存储到日志服务后,可以通过日志服务告警功能实时监控应用服务的各项数据指标,实现告警流程化管理。使用日志服务告警功能时,需要对指定日志主题设置告警策略与通知组,日志服务会根据告警策略中指定的周期定时运行监控任务,对监控范围内的数据进行检索分析,如果检索分析结果满足触发条件,则发送告警通知到指定的接收人。
日志服务告警提供以下功能点:
- 实时数据监控:日志服务基于检索分析功能提供实时的日志数据监控,您可以在告警策略中配置检索分析语句,日志服务会根据指定的策略定期运行该分析语句,监控检索分析结果的变化情况。检索分析语句需要符合日志服务的检索分析语法,详细说明请参考检索语法和分析语法。
- 告警策略管理:日志服务支持根据日志数据的实时监控结果设置告警规则,监控服务的运行状态。告警策略决定了数据监控范围、告警的触发时机、通知方式等逻辑。
- 通知组管理:日志服务通过通知组统一管理告警的通知渠道,告警策略绑定通知组后,告警通知会以指定的方式发送至通知组中定义的各个接收对象,便于及时传递告警信息、恢复业务的正常运行。支持的接收渠道包括邮件、短信、电话、飞书、企业微信、钉钉、自定义 Webhook 等。
- 告警通知:告警通知内容可以设置为普通的字符串,还可以通过内容语法、内容函数和内容变量设计自定义的通知内容,在告警通知中传递更详实清晰的告警信息。
- 开放告警能力:日志服务支持对接第三方的告警能力,例如通过睿象云 Cloud Alert 的监控工具集成功能,使用第三方告警平台实现告警能力对接,您可以通过睿象云管理日志服务的告警事件,实现告警的流程化管理。
使用限制
类别 | 限制项 | 说明 |
---|
告警监控 | 告警策略数量 | 每个日志项目中,最多创建 100 个告警策略。每个日志主题中,最多创建 10 个告警策略。 |
字段值的长度 | 如果字段的值超过 1024 个字符,只截取前 1024 个字符用于分析。 |
检索分析的时间范围 | 每条查询和分析语句的时间跨度不能超过 24 小时。 |
检索分析结果 | - 无集合操作时,监控任务最多选择检索分析结果中的前 1000 行数据用于告警触发;存在集合操作时,监控任务最多选取集合操作结果中的前 1000 行数据用于告警触发。
- 关联监控三个集合时,监控任务最多选取各个检索分析结果中的前 100 行数据用于集合操作。
|
告警表达式长度 | 告警表达式的长度范围为 4~1024 个字符。 |
通知管理 | 通知组数量 | 每个地域最多创建 100 个通知组。 |
通知渠道数量 | 每个通知组中,最多添加 10 个通知渠道。 |
通知内容 | 通知内容的最大长度为 4096 个中文字符。 |
渠道通知频率 | 日志服务各个告警渠道的通知频率限制如下。 - 邮件:无限制。
- 短信:同一手机号码的短信告警通知最大频率为 10条/分钟、100 条/小时、300 条/天。
- 电话:同一手机号码的语音告警通知最大频率为 10条/分钟、100 条/小时、300 条/天。
|
使用流程
- 创建内容模板。
内容模板是一种预定义的文本模板,用于指定告警通知的内容及格式。内容模板支持添加变量、函数、文本等内容。日志服务支持为邮件、短信、电话、飞书、企业微信、钉钉、自定义 Webhook 等各个通知渠道添加内容模板。详细操作步骤请参考创建内容模板。 - 创建通知组。
通知组中需要填写通知类型、通知渠道等配置。如果配置通知渠道为飞书、企业微信、钉钉、自定义 Webhook 等渠道,则可以通过 Webhook 集成配置管理 Webhook 地址。详细操作步骤请参考创建通知组。 - 创建告警策略。
告警策略中需要设置监控任务和告警规则,并绑定通知组。监控任务部分定义告警监控的监控对象与查询分析语句、执行周期,告警规则部分用于定义告警的触发条件和发送告警周期等信息。详细操作步骤请参考创建告警策略。 - 查看告警详情。
日志服务会根据指定的告警策略定期执行监控,触发告警后,您可以通过告警通知中的免登录链接查看告警的详细信息,或通过控制台查看告警历史。详细操作步骤请参考免登录访问告警详情页面和告警历史。
基本概念
基本概念 | 说明 |
---|
告警策略 | 告警策略定义了数据监控方式与告警规则,您需要在策略中指定监控任务、告警规则、告警通知方式等配置项。 |
通知组 | 通知组是告警通知策略的集合,定义了告警通知类型、接收渠道、接收对象等信息。 |
告警触发 | 告警触发是一种告警通知类型。当监控结果满足告警触发表达式时,发送告警通知。 |
告警恢复 | 告警恢复是一种告警通知类型。当监控对象恢复正常时,发送恢复通知。 |
内容模板 | 告警通知内容模板是一种预定义的文本模板,用于指定告警通知的内容及格式。内容模板中支持添加变量,在发送通知时,变量会被替换为实际值。 |
Webhook 集成 | 日志服务支持以 Webhook 集成方式管理飞书、钉钉和企业微信等告警通知渠道。 |