Восстанавливаем lsi raid при замене диска

Восстанавливаем lsi raid при замене диска

Восстанавливаем lsi raid при замене диска

Всем привет сегодня я хочу рассказать поучительную историю, о том как из за невнимательности можно сильно попасть в не хорошую ситуацию. Будет некий такой траблшутинг по восстановлению lsi raid массивов при замене вышедшего из строя диска.

Ппредыстория

В любом сервере рано или поздно начинают выходить из строя жесткие диски или ssd и преждевременная замена спасает вас от потери данных. Но при замене бывает такая вещь как человеческий фактор, который может все погубить.

И так есть сервер IBM с raid контроллером M5015 что в градации LSI 9260-8i. В lsi raid контроллере если диск начинает выходить из строя, то начинает срабатывать счетчик Pred Fail Count и диск следует менять. Как заказать замену диска у IBM я уже рассказывал, останавливать на этом не буду. Допустим диск вы получили и вам осталось его заменить, вы меняете его и обнаруживаете что вытащили не тот диск, что будет дальше.

А дальше все зависит от вида raid собранного у вас. У меня на lsi raid контроллере был raid 10. И когда мой коллега вытащил не тот диск, то с ним ничего не случилось, но если вы засуните на его место новый диск или опять тот же что вытащили, то рейд не восстановится. Новый диск будет видится как unconfigured good а старый как foreign, то есть потерянный.

Тут после возврата старого диска сразу нужно было выполнить процедуру описанную ниже и все бы восстановилось, но бывает что приходит мысль, поменять еще в данной ситуации выходящий из строя диск на новый, и вот тут LSi контроллер, дабы не потерять данные переводит локальные луны в offline, что выражается в остановке сервисов или частичной остановки, на данных дисках.

Восстановление lsi raid

Раз уж так произошло, то не спешите паниковать все еще можно восстановить. Первым делом когда вы вернули не правильно вытащенный диск обратно и он получил статус foreign, на нем осталась конфигурация и ее следует обратно импортировать. Делается это следующим образом. Вы должны были заранее установить утилиту MegaRAID Storage Manager (MSM), в моем случае она стоит на Vmware ESXI 5.5, но может быть и на Windows платформе. Заходим в нее и выбираем пункт Physical и выбираете raid контроллер.

Восстановление lsi raid-01

Теперь открываем пункт Go to > Scan Foreign Configuration. Выполняем сканирование имеющихся конфигураций.

Восстановление lsi raid-02

У вас появится окно с импортированием конфигурации.

ни в коем случае не выбирайте Clear: Remove logical configuration, если только не решили затереть диск

Scan Foreign Configuration-0

Вас спросят действительно ли вы хотите это сделать жмем yes.

Scan Foreign Configuration-01

Если у вас не стоит MSM то вам придется перезагрузить хост и зайти в bios подобное меню. В котором будет приблизительно вот такое окно, где нужно так же импортировать конфигурацию.

Scan Foreign Configuration-2

После данной манипуляции ваши локальные lun перейдут в режим online и если вы до этого заменили сбойный диск на новый, то пойдет процедура rebuild. После чего raid перестроится и начнет нормальное функционирование.

Будьте пожалуйста внимательными иначе последствия могут быть серьезными

Материал сайта pyatilistnik.org

19 Responses to Восстанавливаем lsi raid при замене диска

  1. Эмиль:

    Иван добрый день!
    Вы сталкивались с ошибкой «Operation Failed: ErrorCode = 0x63» при замене диска в рейде?

  2. Иван Семин:

    Нет, но если окажите скриншот и все логи, будет проще понять и опишите ситуацию.

  3. Эмиль:

    Иван, написал Вам скриншот и описание ситуации на почту

  4. Иван Семин:

    Я ответил вам в почте.

  5. Евгений:

    Иван доброго времени суток!
    Ситуация немного похожа на Вашу. Начало расти значение Pred Fail Count. Было решено заменить диск. Новый диск перешел в состояние unconfigured good, но ребилда массива нет. В мануале писано что ребилд должен автоматом начаться. Подскажите пожалуйста как поступить в сложившейся ситуации!

  6. Евгений:

    Что-то мой коммент не видно ( Попутно вопрос, может вернуть старый диск наместо и как то восстановить состояние массива?

  7. Иван Семин:

    А диск у вас не размечен случайно?

  8. Евгений:

    Диск новый, из запечатанной коробки. Может ему drive erase сделать?

  9. Иван Семин:

    Как вариант

  10. Евгений:

    Хотя на диске нет «чужой конфигурации.»

  11. Евгений:

    Добрый день. У меня тоже вылезла ошибка 0x63. Подскажите пожалуйста какая ситуация было в первом комменте!

  12. Владимир:

    Добрый день.Вылетел диск из массива райд 10 на LSI 9260 8i .Купил такой же,что и стоял.Заменил.Запустил комп.Все диски контроллер перевел в «unconfigured good» и слетел виртуальный драйвер.Может кто подскажет что-нибудь.

  13. Иван Семин:

    Вы заменяли в момент работы сервера?

  14. Иван Семин:

    У вас разные диски, хоть и пишут, что объем одинаковый, но может быть разное количество свободных блоков. Ищите оригинальный диск или с таким же числом блоков.

  15. Владимир:

    менял диск при выключенном компе.Диск оригинальный,такой же ,что и был.WD red 4тб.Названия дисков одинаковые и оригинал,не серый.

  16. Владимир:

    И еще,когда комп загружается,комп видит 7 дисков,а в биосе контроллер видит все 8 и все они «unconfigured good».

  17. Иван Семин:

    Нужно посекторно сравнивать.

  18. Иван Семин:

    это не очень хорошо, он считает что на них нет ничего, у вас есть бэкап старой конфигурации? и какой у вас raid контроллер.

  19. Владимир:

    Бэкап не делал, контроллер такой MR lsi 9260 8i

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *