本文介绍出现本地盘故障时,如何完成更换故障硬盘授权操作。
注意
您需认真阅读和使用本文档,本文档视为火山引擎为您提供的云服务器服务规则的组成部分。如果您未按本文档指引进行操作,可能造成您业务损失,您理解并同意您将对此承担全部责任。
收到DiskErrorDetected(硬盘异常)事件时,您可以授权火山引擎更换故障硬盘,避免由于硬盘故障导致实例宕机等更严重的故障。
当实例挂载的本地盘出现故障时,火山引擎将向您同步故障硬盘SN(Serial Number,序列号),方便您在实例内准确定位故障硬盘。
您可以调用DescribeSystemEvents接口,传入硬盘异常事件ID,在返回数据中获取故障硬盘SN。
SystemEvents.ExtraInfo.Address
参数值即为故障硬盘SN。SystemEvents.ExtraInfo.Serial
参数值即为故障硬盘SN。登录挂载故障盘的ECS实例,操作详情可查看登录实例。
执行如下命令,查看故障本地盘盘符。
执行如下命令,查看故障本地盘文件系统与其UUID。
请将
/dev/vda2
替换为上一步中获取的实际故障盘盘符。
blkid /dev/vda2
执行如下命令,编辑/etc/fstab文件。
打开/etc/fstab文件。
vim /etc/fstab
按i
键进入编辑模式,在文件中目标本地盘后添加nofail
参数。
仅需加入
nofail
参数,无需调整其它内容。
fstab文件参数说明
参数 | 说明 |
---|---|
24fd1325-bbf3-4814-b7e9-041deba***** | 故障本地盘的UUID。 |
/ | 故障本地盘挂载点。 |
ext4 | 故障本地盘文件系统类型。 |
nofail | 本地盘出现在文件系统中但实际缺失时,不会中断ECS实例的启动流程。 |
按esc
键,输入:wq
保存修改并退出。
执行如下命令,取消故障本地盘挂载。
umount /dev/vda2
登录云服务器控制台。
在左侧导航树,选择“运维与监控 > 事件监控”,进入事件监控页面。
在顶部导航栏选择业务所在地域与项目。
在事件监控页面,可以通过时间段或事件ID、实例ID搜索目标事件。
单击目标事件“操作”列的“运维操作”按钮,进入运维配置页面。
“运维方式”请选择“更换故障盘”。
(可选)更换故障盘前,如需避免实例中运行的应用不再读写故障盘,减少数据损失,请授权“隔离硬盘”。操作详情可查看隔离本地盘。
单击“授权运维”按钮,并单击确认弹窗中的“确定”按钮,授权火山引擎运维人员更换故障硬盘。
授权后,将生成DiskError.ReplaceDisk(硬盘异常,更换硬盘)事件,提示您更换故障盘进度。
更换故障盘流程出现异常时,将向您发送DiskError.ReplaceDisk:Pending事件通知。收到通知后,您需要根据提示重启实例或提交工单解决异常问题。
通过重启实例解决问题
如下图所示,请您根据指引,单击“重启实例”按钮,重启实例解决异常。
通过工单解决问题
如下图所示,请根据指引,单击“提交工单”按钮,联系火山引擎运维人员协助您解决异常。