本文介绍出现本地盘故障事件时,如何完成隔离故障盘操作。
收到DiskErrorDetected(硬盘异常)事件时,若您直接授权火山引擎更换硬盘,处理期间您的应用还会读写故障的本地盘。建议您先隔离故障盘,确保实例中运行的应用不再读写故障盘,再授权火山引擎更换硬盘,减少数据损失。
登录挂载故障盘的ECS实例,操作详情可查看登录实例。
执行如下命令,查看故障本地盘挂载点。如下步骤以故障本地盘为"/dev/vda2"为例。
df -h
执行如下命令,查看故障本地盘文件系统与其UUID。
blkid /dev/vda2
执行如下命令,编辑/etc/fstab文件。
编辑/etc/fstab文件。
vim /etc/fstab
按i
键,在文件中目标本地盘后添加nofail
参数。
仅需加入
nofail
参数,无需调整其它内容。
fstab文件参数说明
参数 | 说明 |
---|---|
24fd1325-bbf3-4814-b7e9-041deba***** | 故障本地盘的UUID。 |
/ | 故障本地盘挂载点。 |
ext4 | 故障本地盘文件系统类型。 |
nofail | 本地盘出现在文件系统中但实际缺失时,不会中断ECS实例的启动流程。 |
按esc
键,输入:wq
保存修改并退出。
执行如下命令,取消故障本地盘挂载。
umount /dev/vda2
登录云服务器控制台。
在左侧导航树,选择“运维与监控 > 事件监控”,进入事件监控页面。
在顶部导航栏选择业务所在地域与项目。
在事件监控页面,可以通过时间段或事件ID、实例ID搜索目标事件。
单击目标事件“操作”列的“运维操作 > 隔离故障盘”按钮,授权火山引擎隔离故障盘。
隔离过程可能会持续几分钟,如果长时间没有完成隔离,请尝试刷新页面。
隔离完成后,您可以用鼠标箭头指向“隔离故障盘”按钮。
隔离完成后,您可以单击“操作”列的“运维操作 > 授权运维”按钮, 选择“更换故障盘”授权并通知火山引擎运维人员进行维护操作,详情可查看更换故障盘。