Не загружается сервер, ошибка system halted

Не загружается сервер, ошибка system halted

system halted

Добрый день! Уважаемые читатели и гости крупнейшего IT блога России pyatilistnik.org. В сегодняшней заметке, хочу описать ситуацию со стареньким оборудованием Dell PowerEdge 1950. Есть сервер на котором установлена FreeBSD. Была необходимость выполнить сервисное обслуживание операционной системы. Был выключен Dell PowerEdge 1950. Далее после включения, сервер не обнаружил один из виртуальных массивов, после чего выдавал сообщение system halted и не давал далее загружаться. Вот такая вот ситуация, давайте я расскажу, как удалось его воскресить.

Проблема с RAID контроллером PERC 6/i

В моей организации идет процесс вывода из строя старого оборудования, которое много тратит электроэнергии, а толку дает мало. Одним из таких серверов был Dell PowerEdge 1950. Моему коллеги нужно было выполнить на нем работы и перезагрузить его. После перезагрузки выскочили вот такие предупреждения:

Your battery is either charging bad or missing and you have vds configured for write-vback mode. Because the battery is not currently usable,these VDs willl actually run in write-through mode until the battery is fully charged or replaced if it is bad or missing

Обратите внимание, что сервер Dell не видит один из виртуальный дисков VDs, за номером 2,  я выделил это стрелкой.

Не загружается сервер

Далее видно, что найдены 3 Virtual Drive и происходит попытка загрузки сетевой настройки IDRAC, а после него формулировка:

PCIe Degraded link Width Error. И в самом конце System halted!

После чего сервер так висит долгое время, загрузка с дисков или загрузка BIOS не осуществляется.

Не загружается сервер, ошибка system halted

Как решается проблема

ИЗ информации описанной выше мы видим две проблемы:

  • На RAID контроллере PERC 6/i у нас не видится один из виртуальных дисков
  • Проблема с батарейкой RAID контроллера.

Если в момент загрузки нажать CTRL+R, то вы попадете в RAID утилиту.  Зайдя в пункт "PD Mgmt", мы видим 3 диска ,вместо 4, диск под номером 02 не обнаружен.

контроллер PERC 6i не видит диск

В системе он вообще не виделся, и RAID контроллер на него не ругался, просто как будто нет. SMART показатели других дисков были в порядке. Я присмотрелся к индикации HDD на сервере и обнаружил, что один из них моргал, это был как раз 02-ой.

умер жесткий диск на PowerEdge 1950

Но меня больше смущало, что сервер дальше IDRAC не грузился, и я если честно грешил на старый RAID контроллер PERC 6/i.

У меня был выведенный брат близнец этого сервера, и я решил поменять диски с проблемного диска, вставив их в другой выключенный сервер, с таким же RAID контроллером

После включения нового сервера с дисками от старого у меня обнаружилась старая конфигурация всех 4-х массивов.

Если кто-то не в курсе, то все RAID конфиги хранятся на жестких дисках, так что если вы поменяете контроллер на аналогичный, то в большинстве случаев все будет хорошо

Foreign configuration(s) found on adapter/ Press any key to continue or 'C' load the configuration utility, or 'F' to import foreign configuration and continue

Тут важный момент, новый RAID контроллер нашел конфигурацию, о старых виртуальных массивах (Virtual Drives), которую предлагает себе импортировать, соглашаемся и нажимаем кнопку "F"

import foreign configuration

После чего система стала загружаться и я больше не увидел сообщения "system halted". В очередной раз убедился, что всегда нужно иметь все про запас, это хорошо, что сервис сам продублирован и еще не успели убрать на склад старый сервер, который пригодился так кстати.

Восстановили работы PowerEdge 1950

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *