Пищит сервер Supermicro, методы диагностики

Пищит сервер Supermicro, методы диагностики

supermicro logoДобрый день! Уважаемые читатели и гости одного из популярных IT блогов России Pyatilistnik.org. В прошлый раз мы с вами рассмотрели вопрос устранения черного экрана Windows 10, который доставил нам не мало хлопот. Сегодня я хочу с вами поделиться опытом решения проблем с серверами Supermicro, а именно рассмотрим ситуацию почему пищит сервер и горит красная лампочка. Думаю, что у многих в компании есть подобные железки, не у всех же как у меня Dell.

Почему пищит сервер

Расскажу историю из своей практики, необходимо было поменять батарейку на RAID контроллере LSI, сама механическая работа была выполнена и сервер был штатно подключен как раньше. После его включения раздался постоянный писк и на индикаторах с лицевой стороны появилась красная лампочка. Сервер успешно при загрузке показал мне мои три виртуальных массива, что уже говорило, о том, что дело не в RAID контроллере, далее загрузилась моя Windows Server 2016. Но сервер все продолжал орать. По своему опыту могу выделить две ситуации с Supermicro:

  1. Это когда сервер запускается, как у меня
  2. Вторая ситуация, это когда сервер не загружается

Красная лампочка на сервере Supermicro

Из основных причин писка можно отметить:

  • RAID контроллер, у которого есть спикер. чтобы издавать звуки, так как это очень критическая делать сервера, то логично. чтобы он орал как на базаре.
  • Оперативная память, очень часто встречается. Тут вся проблема в том, что какая-то планка ОЗУ имеет ошибки и не пригодна для работы (Пример ошибки Correctable ECC memory error logging limit reached на IBM HS22)
  • Блоки питания

Как выявить причину писка

Если у вас есть RAID контроллер, то первым делом вы должны убедиться в работе ваших дисков, тут можно смотреть на индикацию дисков, чтобы не было красных лампочек, а так же воспользоваться специализированными утилитами, например MSM иди LSA. Убедитесь, что ваши виртуальные RAID группы имеют статус "Optimal"

Как выявить причину писка

Убедитесь, что на дисках нет ошибок "Media Error Count" и "Pred Fall Count".

Проверка RAID контроллера в Supermicro

Если у вас уже начался крошиться диск и он имеет статус "Predictive failure", то срочно его нужно поменять. На время ребилда, вы можете отключить звук писка на вашем контроллере.

Пищит сервер Supermicro

Если же RAID развалился, то можно попробовать его восстановить, у меня есть статья "The following VDs are missing" .в которой я описывал принцип этой операции.

Если у вас RAID контроллере LSI, то советую вам почитать статью, о утилитах управления

Если в RAID контроллером все в порядке, то я вам советую произвести диагностику сервера Supermicro через специализированную утилиту SuperDoctor 5 (Процесс установки SuperDoctor я рассказывал). Заходим в веб интерфейс и начинаем просматривать состояние вашего оборудования. У меня сразу было выявлено, что мой верхний блок питания ушел к про отцам. Вытащив его писк сразу пропал.

находим причину почему Пищит сервер Supermicro

Чуть ниже видно, что у него сломался вентилятор.

не работает блок питания в SuperDoctor 5SuperDoctor 5

Так же у вас при установке SuperDoctor 5, будет такой ярлык на рабочем столе "SuperDoctor 5 Test", запустив его вы получите тестирование вашего оборудования с выгрузкой в отчет.

Так же советую вам посмотреть другие утилиты управления и диагностики Supermicro

Те же данные вы можете получить. если у вас на сервере Supermicro есть IPMI модуль управления. Он вам покажет такую же информацию, что и SuperDoctor 5, но позволит это сделать да же если ваша операционная система не загружается.

SuperDoctor 5 Test

Если у вас проблема с оперативной памятью, то вам необходимо будет так же найти сбойную, в этом может помочь IPMI, SuperDoctor 5, если сервер вообще при запуске не стартует, то придется делать это методом тестирования через утилиту Memtest86 или же вытащить все планку ОЗУ и по очереди их втыкать.

Проверка памяти в Memtest86 на сервере Supermiro

Так же на некоторых серверах, например у HP есть на лицевой стороне сервера индикаторы оперативной памяти на предмет сбоя.

Индикация состояния оперативной памяти на лицевой стороне сервера

На время поставки блока питания, я его просто вытащил из сервера и противный писк на моем Supermicro пропал, лампочки пришли в норму

Причина писка на Supermicro-02

Вот модель моего блока питания

Блок питания Supermicro

На этом у меня все, с вами был Иван Семин. автор и создатель IT портала Pyatilistnik.org.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *