Замена сбойного диска на RAID PERC H740P Adapter в ЦОД
Добрый день! Уважаемые читатели и гости IT блога Pyatilistnik.org. В прошлый раз мы с вами разбирали самые оптимальные методы подключения к удаленному рабочему столу. Движемся дальше и сегодня я хочу с вами поделиться интересным опытом, как можно на удаленной площадке заменить вышедший из строя диск на сервере Dell Power Edge 740 и RAID контроллером PERC H740P Adapte. Думаю что начинающим коллегам это будет интересно. Давайте переходить от слов к делу.
Как менять вышедший из строя SSD диск в RAID PERC H740P Adapter
У меня есть небольшой кластер ESXI 7 на базе серверов PowerEdge R740 с процессорами Intel(R) Xeon(R) Gold 6244 CPU @ 3.60GHz. В качестве дискового массива там на RAID контроллере PERC H740P Adapter собран RAID 1. Все это добро расположено на удаленной площадке в ЦОД. Один из дисков в массиве вылетел. По-хорошему у вас должен быть ZIP-склад в текущих условиях в стране, так как вендоры типа Dell просто по-скотски кинули всех на поддержку, но это их кармический выбор. Нам нужно как-то выкручиваться в такой ситуации.
- 1️⃣Вы можете приобрести такой же диск, если есть возможность. Это самый простой вариант
- 2️⃣В моем случае такой модели не оказалось, пришлось покупать другую, похожую модель. Но пока идет закупка, у меня есть еще один сервер в запасе, диски которого можно использовать в качестве донора. Я опишу данный метод.
Пишу заявку в ЦОД с таким содержанием:
- ✅Вынуть диск из слота 2 сервера Стойка 1\2\3 25-26 Dell PowerEdge R740 (6D6M2S32);
- ✅Вернуть заглушку из слота3 сервера Стойка 1\2\3 28-29 Dell PowerEdge R740 (6D9V2S32);
- ✅Вставить заглушку в слот2 сервера Стойка 1\2\3 25-26 Dell PowerEdge R740 (6D6M2S32);
- ✅Вставить диск в слот3 сервера Стойка 1\2\3 28-29 Dell PowerEdge R740 (6D9V2S32);
В результате у меня в третьем слоте появился SSD диск, но с данными от старого сервера и статусом Foreign.
К сожалению, в веб-интерфейсе IDRAC ничего путного с данным SSD диском выполнить нельзя.
Как удалить диск с Foreign конфигурацией
Первый вариант, это воспользоваться "System Setup" при загрузке сервера. Поэтому отправьте его в перезагрузку и перейдите в данный режим.
Далее идем в раздел "Device Settings".
Выбираем пункт с вашим RAID контроллером, в моем случае это "RAID Controller in Slot 6: Dell PERC H740P Adapter Configuration Utility".
Далее выбираем "Physical Disk Management".
Видим, что есть третий SSD со статусом Foreign.
Выходим из данного меню и идем в "Configuration Management".
Далее идем в раздел "Manage Foreign Configuration".
Далее идем в "Preview Foreign Configuration".
Далее есть раздел "Clear Foreign Configuration"
Соглашаемся с очисткой конфигурации Foreign, которая пройдет за пару секунд.
Второй вариант это использовать утилиту racadm. Для этого подключаетесь по ssh и для начала введите команду, чтобы посмотреть ваш RAID контроллер.
Тут нужно вычислить слот контроллера. У меня это "RAID.Slot.6-1".
Чтобы удалить старую конфигурацию Foreign выполните:
Если старых конфигураций нет, то вы получите сообщение:
ERROR: STOR018 : No foreign drives detected.
If the only foreign drives present are secured,
run either cryptographic erase operation on the
drives or unlock secure foreign config operation
on the controller.
Otherwise the operation failed because there
are no foreign drives. This operation did not
detect any foreign drives.
This may be due to not having any foreign drives
or the only foreign drives being secured.
Далее остается только поменять диски местами и дождаться ребилда.
Как посмотреть статус перестройки RAID (Rebuilding)
Я к сожалению видимо плохо искал в интерфейсе IDRAC, и не смог найти где можно посмотреть статус Rebuilding на новом SSD диске, но не беда, для этого всегда есть командная строка.
Подключаемся по ssh к IDRAC и вводим команду для просмотра всех ваших физических дисков:
Тут вам нужно определить номер слота и правильный путь до нужного диска, в моем примере это "Disk.Bay.1:Enclosure.Internal.0-1:RAID.Slot.6-1". Далее посмотрим статус этого физического диска, через команду:
В итоге видим поле:
- OperationState = Rebuilding
- Progress = 85 %
После операции Rebuilding стало все нормально с " Virtual Disks".
На этому меня все. С вами был Иван Сёмин, автор и создатель IT портала Pyatilistnik.org.
Прежде всего хочу поблагодарить Вас за Вашу статью и не только эту. Очень помогает Ваш блог.
—Я к сожалению видимо плохо искал в интерфейсе IDRAC, и не смог найти где можно посмотреть статус Rebuilding —
На самом деле статус можно посмотреть через idrac в разделе Storage-Physical Disk. Там перечислены все Ваши диски. Нажимаем на + и почти в самом низу Progress — ХХ%
Спасибо за статью. Как удалить диск с Foreign конфигурацией… через idrac 8-9 точно можно выполнить данную процедуру опишу как это сделать в idrac 9:
storage — controllers и в Actions выбираем Foreign Configuration после этого подтверждаем удаление старых данных с диска. я так на работующем сервере заменил все диски большим обьемом… разумеется для того что бы это сделать каждый замененный диск я добавлял к рейду в hot spare (global)… и каждый раз ждал пока диск отребилдится и загорится зеленая галочка в разделе «Summary»… если достать последующий диск недожидаясь ребилда то рейд разрушится (но если его обратно вернуть все восстановится… однако сервер ляжет и это непростительный простой сервера и возможная потеря данных у людей который на данный момент работают на этом сервере)… так что внимательно обращаем на зеленую галочку в idrac 9 в разделе starage — Summary.