You need to enable JavaScript to run this app.
导航
方式二:通过重新部署实例解决本地盘故障
最近更新时间:2024.09.27 17:07:23首次发布时间:2023.09.06 07:43:39

本文介绍出现本地盘故障事件时,如何完成重新部署实例操作。

注意

  • 重新部署实例将会导致原本地盘(实例挂载的全部本地盘,包括故障盘和非故障盘)中的数据全部丢失,请谨慎操作。
  • 若您确定需要重新部署实例,请提前备份本地盘数据,例如通过硬盘、U盘等将重要数据拷贝到外部存储设备。

操作场景

收到DiskErrorDetected(硬盘异常)事件时,您可以授权火山引擎将实例迁移到其他宿主机,恢复实例正常运行。

注意事项

  • 暂仅支持大数据型、本地SSD型、弹性裸金属型和异构计算中使用本地盘的规格族的实例使用本功能。详情可查看实例规格介绍
  • 请确保根据操作步骤指引,移除本地数据盘分区信息后,再进行运维授权,否则重新部署后实例可能无法正常启动。

操作步骤

  1. 登录挂载故障盘的ECS实例,操作详情可查看登录实例

  2. 执行如下命令,进入/etc/fstab文件。

    vim /etc/fstab
    

    示例如下:
    /data00、/data01、/data02为本地数据盘分区挂载点。

  3. i键进入编辑模式,删除所有本地数据盘分区信息,仅保留系统盘挂载信息。

  4. ecs键,输入:wq保存修改并退出文件。

  5. 完成/etc/fstab文件修改后,即可进行重新部署实例操作。

  6. 登录云服务器控制台

  7. 在左侧导航树,选择“运维与监控 > 事件监控”,进入事件监控页面。

  8. 在顶部导航栏选择业务所在地域与项目。

  9. 在事件监控页面,可以通过时间段或事件ID、实例ID搜索硬盘异常事件。

  10. 单击目标事件“操作”列的“运维操作”按钮,进入运维配置页面。

    授权后,火山引擎将生成DiskError.Redeploy (硬盘异常,实例重新部署)事件,同步您重新部署实例进度。

    1. “运维方式”请选择“重新部署实例”。
    2. 单击“授权运维”按钮。
    3. 在弹窗中选择期望重新部署实例的时间。
  11. 成功重新部署实例后,火山引擎将向您发送DiskError.Redeploy:Succeeded(硬盘异常,实例重新部署)处理成功事件。收到通知后,您需要登录实例挂载本地盘。

    说明

    • 若重新部署实例后,实例未识别到本地盘,请提交工单获取技术支持。
    • 推荐您使用设备名(如/dev/data1)而非UUID进行挂载。
    1. 登录实例
    2. 执行如下命令,查看未挂载的数据盘信息。
      lsblk -l
      
    3. 执行如下命令,为待挂载的数据盘制作文件系统。
      mkfs -t <文件系统> <设备名>
      
    4. 执行如下命令挂载数据盘。
      mount <设备名> <挂载点>
      
  12. 执行如下命令,确认数据盘是否挂载成功。

    lsblk -l