在CentOS 7操作系统本地SSD型实例中执行fio
命令压测本地盘时,出现NMI watchdog: BUG: soft lockup - xxx
错误。
由于CentOS 7.x操作系统kernel存在BUG,导致NVMe SSD本地直通盘的I/O中断都发送至某一CPU上,当该CPU的SI(software irq,软件中断)达到100
时,将出现故障。
在故障实例中执行如下命令。
rmmod nvme nvme_core modprobe nvme use_threaded_interrupts=1
注意
本方案将新增irq进程,增加实例CPU的额外损耗,占用部分CPU。