Пищит сервер Supermicro, методы диагностики
Добрый день! Уважаемые читатели и гости одного из популярных IT блогов России Pyatilistnik.org. В прошлый раз мы с вами рассмотрели вопрос устранения черного экрана Windows 10, который доставил нам не мало хлопот. Сегодня я хочу с вами поделиться опытом решения проблем с серверами Supermicro, а именно рассмотрим ситуацию почему пищит сервер и горит красная лампочка. Думаю, что у многих в компании есть подобные железки, не у всех же как у меня Dell.
Почему пищит сервер
Расскажу историю из своей практики, необходимо было поменять батарейку на RAID контроллере LSI, сама механическая работа была выполнена и сервер был штатно подключен как раньше. После его включения раздался постоянный писк и на индикаторах с лицевой стороны появилась красная лампочка. Сервер успешно при загрузке показал мне мои три виртуальных массива, что уже говорило, о том, что дело не в RAID контроллере, далее загрузилась моя Windows Server 2016. Но сервер все продолжал орать. По своему опыту могу выделить две ситуации с Supermicro:
- Это когда сервер запускается, как у меня
- Вторая ситуация, это когда сервер не загружается
Из основных причин писка можно отметить:
- RAID контроллер, у которого есть спикер. чтобы издавать звуки, так как это очень критическая делать сервера, то логично. чтобы он орал как на базаре.
- Оперативная память, очень часто встречается. Тут вся проблема в том, что какая-то планка ОЗУ имеет ошибки и не пригодна для работы (Пример ошибки Correctable ECC memory error logging limit reached на IBM HS22)
- Блоки питания
Как выявить причину писка
Если у вас есть RAID контроллер, то первым делом вы должны убедиться в работе ваших дисков, тут можно смотреть на индикацию дисков, чтобы не было красных лампочек, а так же воспользоваться специализированными утилитами, например MSM иди LSA. Убедитесь, что ваши виртуальные RAID группы имеют статус "Optimal"
Убедитесь, что на дисках нет ошибок "Media Error Count" и "Pred Fall Count".
Если у вас уже начался крошиться диск и он имеет статус "Predictive failure", то срочно его нужно поменять. На время ребилда, вы можете отключить звук писка на вашем контроллере.
Если же RAID развалился, то можно попробовать его восстановить, у меня есть статья "The following VDs are missing" .в которой я описывал принцип этой операции.
Если в RAID контроллером все в порядке, то я вам советую произвести диагностику сервера Supermicro через специализированную утилиту SuperDoctor 5 (Процесс установки SuperDoctor я рассказывал). Заходим в веб интерфейс и начинаем просматривать состояние вашего оборудования. У меня сразу было выявлено, что мой верхний блок питания ушел к про отцам. Вытащив его писк сразу пропал.
Чуть ниже видно, что у него сломался вентилятор.
Так же у вас при установке SuperDoctor 5, будет такой ярлык на рабочем столе "SuperDoctor 5 Test", запустив его вы получите тестирование вашего оборудования с выгрузкой в отчет.
Те же данные вы можете получить. если у вас на сервере Supermicro есть IPMI модуль управления. Он вам покажет такую же информацию, что и SuperDoctor 5, но позволит это сделать да же если ваша операционная система не загружается.
Если у вас проблема с оперативной памятью, то вам необходимо будет так же найти сбойную, в этом может помочь IPMI, SuperDoctor 5, если сервер вообще при запуске не стартует, то придется делать это методом тестирования через утилиту Memtest86 или же вытащить все планку ОЗУ и по очереди их втыкать.
Так же на некоторых серверах, например у HP есть на лицевой стороне сервера индикаторы оперативной памяти на предмет сбоя.
На время поставки блока питания, я его просто вытащил из сервера и противный писк на моем Supermicro пропал, лампочки пришли в норму
Вот модель моего блока питания
На этом у меня все, с вами был Иван Семин. автор и создатель IT портала Pyatilistnik.org.
Привет Иван.
Годная статья. А поделись мыслью, что может быть такое — в общем сервер супермикро X8DT3 на 2 таких серверах проблема с писком. В них стоят 2 блока питания, один блок питания под нагрузкой, другой обесточен. При включении сервера с 2 блоками идет вой. При вытаскивании 1 любого блока питания из сервера не пищит, менял местами блоки, запитывал разные (из 2-х), странное поведение — пищит только с 2-мя блоками. Работает на 1 из 2 любых блоков. В чем может быть причина — плата управления, которая идет на материнку? Визуально там все в порядке (ни нагара, ни вздутия конденсаторов нет). Может быть сталкивался с похожей причиной? Именно почему-то супермикры. Ведь если блок мертвый, он не должен запускать сервер, а здесь с любым из двух работает, вместе — не хочет (1 запитан, 2 нет).
Спасибо за твой ответ.
Может что-то со схемой ACPI в BIOS?
Поковырялся в серверной, попереключал. Это видимо защита, и писк появляется когда обесточен 1 блок из 2 (вроде как у Вас остался в работе 1 блок и если ему конец то сервер выключится). Т.е. с 2-мя включенными одновременно в сеть не пищит. Чудеса.
Все-таки где-та эта штука должна отключаться.
Здравствуйте, возникла проблема с сервером от той же компании. Сервер 2008 года. Когда включаю начинает также орать. Во время загрузки сервкра пишется мол: «Идет установка связи
Ошибка: проверьте кабель»
Потом пишется, что надо перезапустить сервер и что типа заново подключите загрузочное устройсво в сервер