Predictive failure статус диска в VMware ESXI 5.5
Всем привет сегодня хочу рассказать, что значит Predictive failure статус диска в VMware ESXI 5.5. Поговорим, как это исправить, чтобы не потерять данные. Predictive failure означает, что ваш жесткий диск скоро выйдет из строя. Чаще всего когда сервер видит такой диск он начинает издавать не приятные звуковые сигналы привлекающие ваше внимание. И лампочка диска подсвечивается желтым предупредительным огоньком.
Predictive failure в предупреждении VMware ESXI 5.5
У меня есть сервер IBM System x3650 M3, на нем установлен VMware ESXI 5.5. В один прекрасный день появилось предупреждение от ESXi хоста, вот такого вида
Смысл сразу понятен, стал крошиться диск, писка от сервера не было так как было выключено специально, достаточно этого мониторинга. Раскрыв более детально вкладку Hardware Status - Drive. Мы видим, что крошится диск в слоте 3, у серверов IBM диски начинаются с 0 слота, если у меня 3 слот выходит из строя, то мне нужно менять 4-ый диск слева (0,1,2,3)
Удостовериться что это именно 4 диск из третьего слота можно через утилиту MegaRAID Storage Manager (MSM), которую я рассказывал как поставить в ESXi. Залогинившись в MegaRAID Storage Manager, выбираем нужный slot. У меня это 3, и смотрим поле Pred Fail Count, должно быть 0, у меня уже 17 ошибок, что плохо по S.M.A.R.T.
ради эксперимента посмотрим значение Pred Fail Count у другого диска, выбираю жесткий диск из slot 4 и вижу, что у него это значение равно 0, что означает, что с ним все в порядке.
Так же Predictive failure показывает и IMM порт управления. Ваши действия в данной ситуации, это конечно замена диска. Процесс замены и обращения в тех поддержку я описывал ранее. Еще такая же ошибка с диском может быть в виде ошибки host storage status в vCenter 5.5. Не забывайте мониторить smart показатели ваших дисков.
После замены диска, которое производится на живую, спасибо технологии RAID, у вас начнется процедура Rebuild
Процесс ребилда, можно отслеживать на dashboard
Материал сайта pyatilistnik.org
У меня от такой штуки сервер умер!
Это логично, диск же крошится