Flink 控制台提供了任务详情页,您可以查看任务基础信息、任务配置详情、监控指标数据曲线、快照、日志、告警配置等信息。
展示任务当前的配置详情,包含以下信息:
args[]
参数。当是 Ray 任务时展示代码文件、Entrypoint 等信息。当是 Python 任务时展示 Python File URI、 Entry Point Main Arguments 等信息。
当您为 Flink 任务配置了上下游信息,便可以在任务详情中查看到任务的数据血缘关系。
支持 Hive 和 Others 两类。类型为 Hive 时,可以看到设置的 Catalog、Database、Table;数据类型为 Others 时,可以看到数据源的连接地址。
记录任务运行的整条链路上的关键事件,并打印出关键信息。方便运维人员排查、分析、查找错误原因。
同时可以直接查看实例的配置详情。
流式计算 Flink 版已经对接云监控服务,提供 Flink 任务的监控和告警能力。
Flink 任务详情中的数据曲线页签下,展示当前任务的监控指标数据曲线。您可以按需查看 Overview、Network&IO、JVM、Schedule Info、Watermark、checkpoint view、checkpoint timer、Checkpoint Operator Performance、resource、Kafka 等不同维度的核心指标情况,通过分析监控指标,能快速发现任务运行是否异常。
说明
在数据曲线页面提供了图表联动功能。
勾选该功能后,鼠标悬停在任意一个监控曲线图,都能同时查看到其他所有曲线图在相同时间的指标详情信息。
Flink 平台已经支持为任务开启自动调优。开启后,系统将自动分析运行任务,将根据上游 Kafka 的 Lag 调整 Flink 计算任务的资源使用量,从而降低资源使用量。
如果您在任务开发侧已经启用了自动调优,则可以在任务详情页面的查看到调优规则和调优记录;如果在任务开发侧未开启,您也可以在任务详情页面开启自动调优。
注意
开启任务自动调优前,需要先了解以下注意事项:
在任务详情页面,如果是首次启用自动调优,请单击立即编辑;如果需要修改调优规则,请单击编辑规则。启用或修改调优规则将立即生效,无需重新启动任务。
配置 | 说明 |
---|---|
不生效时间 | 设置每天自动调优的不生效时间段,即在该时间段内智能调优正常运行但不进行任何调优调整。 |
最大资源限制 | 设置任务在自动调整资源时,可以扩容的最大资源上限,单位为 CU。 |
调整间隔时间 | 设置任务在调优重启生效一次之后,下一次再进行调优的时间间隔,单位为 min。 |
展示 Flink 任务 5 天内手动创建和系统创建的任务快照。
快照主要用于系统出现故障时,使用快照恢复任务,不会出现数据丢失。此处不做详细介绍,如需了解快照的创建和使用,请参见作业快照。
在任务详情页的日志页签下,您可以查看当前任务的日志详情。系统会保留 7 日内的日志。在日志保留期间,可以查看任务的历史日志。
任务类型 | 说明 |
---|---|
Flink |
|
Ray |
|
流式计算 Flink 版已经对接云监控服务,提供 Flink 任务的监控和告警能力。
在 Flink 任务详情中的告警配置页签下,您可以单击前往云监控配置告警规则,以创建针对当前任务创建告警规则和告警通知方式。当监控指标达到告警阈值,系统将触发告警事件,并向告警联系人发送告警消息,有助于及时发现并处理任务异常。
如何创建告警策略,请参见创建告警策略。