DataLeap 智能运维助手旨在满足用户线上任务运维的需求,例如任务运行失败、运行变慢等场景下的运维诊断和优化建议操作。其目标是助力用户快速定位并解决问题,提升用户任务运维的效率。
DataLeap 智能运维助手的底层能力整合了统一的日志服务、大模型以及产品知识库。其基本运行原理为获取任务实例的所有行为(包括执行日志详情分析、资源使用分配、任务变更记录等)并加以分析,持续积累、分析并整合运维的事件处理经验,来构建有效的运维知识库。当相同的运维事件再度出现时,能够快速且有效地基于知识库沉淀的经验来处置线上任务运维事件。
本文将为您介绍 DataLeap 智能运维助手的相关能力。
DataLeap 智能运维助手,目前仅在华北2(北京)、华东2(上海)、华南1(广州)地域开放,当前功能处于邀测阶段,如需使用,您可通过提工单的方式,咨询 DataLeap 技术支持人员进行开通使用。
数据开发调试运维主要面向开发调试场景。以往在开发过程中,仅以执行日志的形式为您提供错误排查方向,解读日志主要依赖您排查问题的经验,因此任务错误排查在调试阶段的效率往往较低。
在本次数据开发调试日志里,凭借智能调试诊断插件的能力,提供调试时间轴。在该时间轴中,能够清晰展示任务运行过程中的每个运行分支阶段和节点信息,展现效果如下:
注意
说明
也可以使用Ctrl
+ Shift
+ X
(Mac下使用 ⌘
+ Shift
+ X
),用快捷键方式来快速开启插件市场。
本部分内容主要针对任务运行后发生的错误、延迟的诊断,基于大模型的能力,对运行日志进行分析,解析出错误栈,并与运维知识库进行匹配,获取错误原因以及解决方案。
DataLeap 智能运维助手以项目维度按需开通,开通操作流程如下:
注意
开通后,当天已经例行运行的任务实例,不会触发智能运维服务。手动重新执行后,便可触发服务。
在项目控制台,开通智能运维开发助手能力后,您可以从以下路径进入智能运维界面:
以往在日志概览页签中,仅提供了任务日志的 tracking URL 链接信息,而没有其他更详细的日志信息。
优化后的智能运维中的日志概览,将基于智能运维解析的能力,对日志进行解读和总结输出,同时能够总结错误信息。为您提供更全面、详细的日志解读信息,帮助您更好地理解和分析任务运行情况,提高运维效率和质量。
示例如下:
智能运维可以对运行失败的实例进行错误诊断,为您提供清晰的运行错误总结、错误原文、原因解读以及相应的解决方案建议。这能够极大程度地为您节省排查错误日志问题的时间,帮助您快速找到解决问题的方法。
您还可以对智能运维提供的解决方案进行点赞或点踩操作,这将为您的运维知识库提供更多有效的解决方案建议,进一步丰富运维知识库。
示例如下:
在日志详情界面,智能运维可对日志详情进行每个关键步骤的详细解读与总结,示例效果如下:
借助智能运维日志解读,您能够显著提升对日志详情的可读性。目前,平台会对所有日志进行解读。我们期望使用更为通俗易懂的文案来解释日志,从而增强其可读性。