Замена сбойного диска на RAID PERC H740P Adapter в ЦОД

PERC H740P AdapterДобрый день! Уважаемые читатели и гости IT блога Pyatilistnik.org. В прошлый раз мы с вами разбирали самые оптимальные методы подключения к удаленному рабочему столу. Движемся дальше и сегодня я хочу с вами поделиться интересным опытом, как можно на удаленной площадке заменить вышедший из строя диск на сервере Dell Power Edge 740 и RAID контроллером PERC H740P Adapte. Думаю что начинающим коллегам это будет интересно. Давайте переходить от слов к делу.

Как менять вышедший из строя SSD диск в RAID PERC H740P Adapter

У меня есть небольшой кластер ESXI 7 на базе серверов PowerEdge R740 с процессорами Intel(R) Xeon(R) Gold 6244 CPU @ 3.60GHz. В качестве дискового массива там на RAID контроллере PERC H740P Adapter собран RAID 1. Все это добро расположено на удаленной площадке в ЦОД. Один из дисков в массиве вылетел. По-хорошему у вас должен быть ZIP-склад в текущих условиях в стране, так как вендоры типа Dell просто по-скотски кинули всех на поддержку, но это их кармический выбор. Нам нужно как-то выкручиваться в такой ситуации.

SYSTEM HAS CRITICAL ISSUES

Fault detected on drive 1 in disk drive bay 1.

  • 1️⃣Вы можете приобрести такой же диск, если есть возможность. Это самый простой вариант
  • 2️⃣В моем случае такой модели не оказалось, пришлось покупать другую, похожую модель. Но пока идет закупка, у меня есть еще один сервер в запасе, диски которого можно использовать в качестве донора. Я опишу данный метод.

Пишу заявку в ЦОД с таким содержанием:

  • ✅Вынуть диск из слота 2 сервера Стойка 1\2\3 25-26 Dell PowerEdge R740 (6D6M2S32);
  • ✅Вернуть заглушку из слота3 сервера Стойка 1\2\3 28-29 Dell PowerEdge R740 (6D9V2S32);
  • ✅Вставить заглушку в слот2 сервера Стойка 1\2\3 25-26 Dell PowerEdge R740 (6D6M2S32);
  • ✅Вставить диск в слот3 сервера Стойка 1\2\3 28-29 Dell PowerEdge R740 (6D9V2S32);

В результате у меня в третьем слоте появился SSD диск, но с данными от старого сервера и статусом Foreign.

Замена вышедшего из строя SSD на PowerEdge

К сожалению, в веб-интерфейсе IDRAC ничего путного с данным SSD диском выполнить нельзя.

Действия с SSD диском в IDRAC

Как удалить диск с Foreign конфигурацией

Первый вариант, это воспользоваться "System Setup" при загрузке сервера. Поэтому отправьте его в перезагрузку и перейдите в данный режим.

Вход в режим System Setup

Далее идем в раздел "Device Settings".

Вход в Device Settings

Выбираем пункт с вашим RAID контроллером, в моем случае это "RAID Controller in Slot 6: Dell PERC H740P Adapter Configuration Utility".

Вход RAID Controller in Slot 6: Dell PERC H740P Adapter Configuration Utility

Далее выбираем "Physical Disk Management".

Вход Physical Disk Management

Видим, что есть третий SSD со статусом Foreign.

SSD со статусом Foreign

Выходим из данного меню и идем в "Configuration Management".

Вход в Configuration Management

Далее идем в раздел "Manage Foreign Configuration".

Вход в раздел Manage Foreign Configuration

Далее идем в "Preview Foreign Configuration".

Вход в раздел Preview Foreign Configuration

Далее есть раздел "Clear Foreign Configuration"

Очистка конфигурации Foreign

Соглашаемся с очисткой конфигурации Foreign, которая пройдет за пару секунд.

Все что есть на физическом диске будет полностью удалено

Второй вариант это использовать утилиту racadm. Для этого подключаетесь по ssh и для начала введите команду, чтобы посмотреть ваш RAID контроллер.

racadm storage get controllers -o

Тут нужно вычислить слот контроллера. У меня это "RAID.Slot.6-1".

racadm получить информацию по RAID контроллеру

Чтобы удалить старую конфигурацию Foreign выполните:

racadm storage clearconfig:RAID.Slot.6-1

Если старых конфигураций нет, то вы получите сообщение:


ERROR: STOR018 : No foreign drives detected.
If the only foreign drives present are secured,
run either cryptographic erase operation on the
drives or unlock secure foreign config operation
on the controller.
Otherwise the operation failed because there
are no foreign drives. This operation did not
detect any foreign drives.
This may be due to not having any foreign drives
or the only foreign drives being secured.

No foreign drives detected

Далее остается только поменять диски местами и дождаться ребилда.

Замена вышедшего из строя диска в сервере Dell

Как посмотреть статус перестройки RAID (Rebuilding)

Я к сожалению видимо плохо искал в интерфейсе IDRAC, и не смог найти где можно посмотреть статус Rebuilding на новом SSD диске, но не беда, для этого всегда есть командная строка.

Подключаемся по ssh к IDRAC и вводим команду для просмотра всех ваших физических дисков:

racadm storage get pdisks

Тут вам нужно определить номер слота и правильный путь до нужного диска, в моем примере это "Disk.Bay.1:Enclosure.Internal.0-1:RAID.Slot.6-1". Далее посмотрим статус этого физического диска, через команду:

racadm storage get pdisks:Disk.Bay.1:Enclosure.Internal.0-1:RAID.Slot.6-1

В итоге видим поле:

  •  OperationState = Rebuilding
  • Progress = 85 %

Как узнать прогресс восстановления raid на контроллере Dell

После операции Rebuilding стало все нормально с " Virtual Disks".

 Virtual Disks

На этому меня все. С вами был Иван Сёмин, автор и создатель IT портала Pyatilistnik.org.

Оцените статью
Настройка серверов windows и linux
Добавить комментарий

  1. Дмитрий

    Прежде всего хочу поблагодарить Вас за Вашу статью и не только эту. Очень помогает Ваш блог.
    —Я к сожалению видимо плохо искал в интерфейсе IDRAC, и не смог найти где можно посмотреть статус Rebuilding —
    На самом деле статус можно посмотреть через idrac в разделе Storage-Physical Disk. Там перечислены все Ваши диски. Нажимаем на + и почти в самом низу Progress — ХХ%

  2. Артем

    Спасибо за статью. Как удалить диск с Foreign конфигурацией… через idrac 8-9 точно можно выполнить данную процедуру опишу как это сделать в idrac 9:
    storage — controllers и в Actions выбираем Foreign Configuration после этого подтверждаем удаление старых данных с диска. я так на работующем сервере заменил все диски большим обьемом… разумеется для того что бы это сделать каждый замененный диск я добавлял к рейду в hot spare (global)… и каждый раз ждал пока диск отребилдится и загорится зеленая галочка в разделе «Summary»… если достать последующий диск недожидаясь ребилда то рейд разрушится (но если его обратно вернуть все восстановится… однако сервер ляжет и это непростительный простой сервера и возможная потеря данных у людей который на данный момент работают на этом сервере)… так что внимательно обращаем на зеленую галочку в idrac 9 в разделе starage — Summary.