任务运行过程中可能因为某些原因导致任务失败,如果用户想及时感知到这类状态的变化,可以使用平台的消息通知功能。
目前仅支持通过 邮件 向用户发送通知。
说明
由于安全手机或邮箱是敏感信息,默认子账号不具备自主绑定邮箱的权限。
完成邮箱的绑定有如下几种方式:
管理员(主账号或具备 IAM 权限的子账号)直接为普通用户绑定邮箱:管理员前往【访问控制】-【用户】页面,在该用户的详情页绑定邮箱,该用户收到验证邮件后完成激活。
普通用户自主绑定邮箱:
目前只要用户配置了联系方式,平台在出现了以下场景时便会向用户发送对应的消息。
触发场景 | 建议的处理方法 |
---|---|
平台自动检测到任务所在的节点出现故障 | 及时停止任务避免在后续的运行过程中任务出现非预期的失败,同时也便于平台处理故障机器 |
任务使用的闲时资源被回收导致任务被停止 | 若任务有配置重试规则将会自动重试,可无需处理 |
任务运行过程中变为失败 或完成 的状态 | 及时通过任务的监控、日志排查失败原因,正常运行完成则无需特别处理 |
任务进入保留阶段 | 及时通过 WebShell 或者 WebIDE 登录到任务的容器中排查失败原因 |
任务的优先级被人调整 | 通常是队列管理员的人为干预,无需特别处理 |
任务运行超过最长运行时间触发自动停止 | 前往控制台观察是否符合预期 |
任务被手动停止 | 前往控制台观察是否符合预期 |