DataLeap 运维中心可对已上线的任务进行管理运维,支持离线任务运维和实时任务运维。针对不同类型任务的特性,提供不同的运维功能,如任务智能诊断、数据回溯、任务重跑等运维操作。
离线任务运维
包括运维概览、任务运维、实例运维、数据回溯和报警监控,各模块具体功能如下:
- 运维概览:
展示项目下已上线任务的整体情况,帮助您宏观上了解当日的任务实例状态分布、运行时段分布概览,以及各负责人任务数量、任务类型分布、任务调度方式分布、历史的任务运行情况分析与排名等信息。 - 任务运维:
- 展示项目下已上线的离线任务。
- 按需查看任务依赖 DAG 图、任务优先级等任务信息。
- 对任务进行数据回溯、监控设置等运维操作。
- 对任务进行开启/关闭等状态操作。
- 实例运维:
- 展示任务的运行实例信息。
- 实时查看实例状态变化,通过依赖、诊断和日志快速定位异常。
- 对实例进行重跑、置成功、终止等操作。
- 数据回溯:
通过数据回溯,完成任务在指定历史时间范围内的补数据/重跑操作,支持单任务、单任务及其下游、多任务、多任务及其下游的回溯操作,发起回溯后,您可在实例运维中查看回溯的实例。 - 报警监控:
- 离线报警监控功能,展示当前项目下已创建的离线任务、准实时监控信息,监控类型包括规则监控和基线监控。
- 通过报警记录模块,可查看项目下全部已触发的报警。
实时任务运维
包括运维概览、任务运维和报警监控,各模块具体功能如下:
- 运维概览:
展示项目下已提交上线的流式任务整体情况,帮助您宏观了解流式任务实例执行状态分布、资源使用分析等概览情况,从任务类型、任务负责人方向进行快速筛选任务进行查看分析,帮助您更好的了解项目下流式任务的运行情况,能够及时发现并处理异常任务,提升流式任务运维效率。 - 任务运维:
- 展示项目下已上线的任务。
- 查看任务运行状态、任务血缘、操作日志、执行日志等信息。
- 对任务进行报警设置和报警屏蔽操作。
- 对任务进行重启、停止等状态操作。
- 报警监控:
- 展示项目下已创建的流式作业执行监控规则。
- 通过报警记录模块,查看项目下全部已触发的流式任务报警。