Как запросить замену диска в сервере у IBM

ibm

Добрый день уважаемые читатели блога, сегодня хотел бы поделиться опытом как запросить замену диска в сервере у IBM. Ни для кого не секрет, что работа серверов 24/7, через несколько лет начинает косить винты, в один из прекрасных дней вы придя на работу услышите писк из серверной, и начав разбираться увидите, что пищит сервер IBM. На самом сервере в районе винтов вы увидите, что на одном или не дай Бог нескольких винтах горит желтая лампочка.

Как запросить замену диска в сервере у IBM-011

Как запросить замену диска в сервере у IBM-011Она сигнализирует, что диск в данном RAID массиве вышел из строя. В некоторых случаях он еще не умер, а просто валился из RAID, для начала просто его вытащите и снова воткните, если через некоторое время лампочка продолжает гореть то приступаем к следующему шагу. Да еще хотел отметить, что посмотреть статус RAID в сервере IBM, можно утилитой MSM.

Заходим в нее и видим, что на вкладке Physical у нас один из винтов красного цвета, это значит что он все вышел из строя, намертво.

Как запросить замену диска в сервере у IBM-01
Как запросить замену диска в сервере у IBM-Сломанный диск

После, этого нам нужно обратиться в тех поддержку компании IBM, и собрать для них логи. Как собрать логи утилитой DSA читайте тут. Так же на каждом сервере вам нужно записать его MTM, SN и Product ID, найти их можно слева от винтов, еще техническая поддержка может вас попросить выслать ibm fru номер жесткого диска.

 

Как запросить замену диска в сервере у IBM-12
Как запросить замену диска в сервере у IBM-12

После сбора логов отправляем письмо в техническую поддержу, по адресу

hwsupport@ru.ibm.com

Далее ждем когда приедет курьер и привезет диски. Заменяем их на убитые HDD и начинается процесс Rebild в RAID.

Как запросить замену диска в сервере у IBM-13
Как запросить замену диска в сервере у IBM-13

Наблюдать его статус можно через MSM утилиту.

Как запросить замену диска в сервере у IBM-02
Как запросить замену диска в сервере у IBM-Rebuil RAID

и также можно посмотреть сколько по времени это займет, на главной странице утилиты вы увидите ползунок

Как запросить замену диска в сервере у IBM-03
Как запросить замену диска в сервере у IBM-03

Нажав More details вы увидите более подробную информацию

Как запросить замену диска в сервере у IBM-04
Как запросить замену диска в сервере у IBM-04

Надеюсь данная статья вам помогла и вы сэкономили немного времени и нервных клеток. Материал сайта pyatilistnik.org

Оцените статью
Настройка серверов windows и linux
Добавить комментарий

  1. Сергей

    Добрый день. Подскажите пож-та, сейчас у меня рейд в статусе разрушен, один диск вылетел, установил новый (той же серии) но ни чего не происходит. Желтая лампочка при этом не горит и не горела, ни на самом диске ни на панели. Может быть надо где настроить, что бы горела желтая лампочка? Server X3300 M4, диски не родные (не IBM). Спасибо

  2. Иван Семин автор

    Сергей, первое что нужно сделать это поставить программу управления RAID контроллером, если у вас LSI то ставим MSM http://pyatilistnik.org/kak-ustanovit-megaraid-storage-manager-msm-v-windows-server-2012r2/ если adaptec то ставим ASM http://pyatilistnik.org/kak-ustanovit-adaptec-storage-manager/
    зайдя внутрь, можно посмотреть как видится новый диск контроллером, и принудительно сказать rebuild и как минимум посмотреть лог файл.
    А могли бы вы подсказать точно модель контроллера

  3. Сергей

    Спасибо за скорый ответ. Модель контроллера M1115. В моем случае меня интересует почему не горят желтые лампочки на самом диске и на панели сверху? Спасибо еще раз

  4. Иван Семин автор

    а в каком статусе у вас видится в MSM ваш новый диск и какой статус RAID?

  5. Сергей

    MSM пока не установил еще, в Megaraide диск был красным цветом, а рейд кажется в статусе разрушен (вроде бы так)

  6. Иван Семин автор

    Нужно посмотреть с помощью MSM, статусы и логи так быстрее можно понять проблему, либо можно логи снять утилитой MEGACLI, но MSM нагляднее все показывает

  7. Сергей

    проблем после установки MSM не было? у меня сейчас сервер работает, 200 чел онлайн

  8. Сергей

    все установил MSM, Диск 6 — unconf good, Virtual drive — Degraded.
    _ttps://drive.google.com/file/d/0B6eEbnHYQfeBZWxlSTlHQm81YXc/view?usp=sharing
    _ttps://drive.google.com/file/d/0B6eEbnHYQfeBY1RjSVNkdWJPOGM/view?usp=sharing

  9. Сергей

    установил, один диск — Unconfig good, Virtual drive — Degraded
    _ttps://drive.google.com/file/d/0B6eEbnHYQfeBZWxlSTlHQm81YXc/view?usp=sharing
    _ttps://drive.google.com/file/d/0B6eEbnHYQfeBY1RjSVNkdWJPOGM/view?usp=sharing

  10. Сергей

    установил, один диск — Uncofig good, Virtual drive — degraded.
    Хотел ссылку на скрин скинуть суда, не получается

  11. Иван Семин автор

    Сделайте его правым кликом Online если такого нет то попробуйте его сделать как Assign Global Hot Spare

  12. Иван Семин автор

    И покажите ещ пож скрин с dashboard

  13. Иван Семин автор

    Я произвел на тестовом, после Assign Global Hot Spare должен начаться ребилд

  14. Сергей

    _ttps://drive.google.com/file/d/0B6eEbnHYQfeBa0N2UWdMV1J5NXc/view?usp=sharing
    После ребилда я не потеряю инфу? Переживаю! может быть после бэкапа сделать?

  15. Иван Семин автор

    Если вы его не сделаете то потеряете, ребилд это стандартная операция восстановления RAID, которая перекидывает дублирующая информацию на hdd дублер.

  16. Сергей

    ночью на всякий случай сделаю бэкап, а после все что Вы писали! Спасибо! А на счет желтых индикаторов не подскажите почему не горят?

  17. Иван Семин автор

    индикатор загорится как только начнется ребилд, сейчас диск находится в подвешенном состоянии ни туда ни сюда, отпишитесь пож как у вас все пройдет

  18. Сергей

    Хорошо! Спасибо!

  19. Сергей

    пока еще не делал, в это воскресенье буду делать. Просьба не удалять статью и комментарии. спасибо

  20. Сергей

    Добрый день. Сделал как Вы писали Asifn Global Hot Spare, начался ребилд. Сейчас работает как надо, спасибо большое за помощь!!!

  21. Иван Семин автор

    рад что мой опыт вам помог и вы научились чему то новому

  22. Iwan

    Иван, помогите советом, если есть возможность ответить.
    У нас на сервере IBM System x3400 M3 Server -7379ZLP полетел один жёсткий диск. Проверили документы, оказалось, что уже не гарантийный. Сервер вообще не загружался (даже БИОС не грузил), просто чёрный экран. Вытащили все три диска, поставили три новых диска, но не фирмы IBM, БИОС загрузился. Стали думать как был сконфигурирован RAID, контроллер LSI, поддерживающий только RAID 0,1, и 10, а диска всего три. Стали звонить в техподдержку фирмы, где приобретали, они посоветовали позвонить всё же в IBM и уточнить на счёт гарантии, позвонили, оказывается наш сервер ещё гарантийный, вытащили новые диски, вставили старые, БИОС сервера загрузился, собрали логи для IBM, они обещали выслать один новый жёсткий диск, но по срокам пока не понятно, когда придёт. БИОС загрузился, но винда не загружается. Наш RAID получается развалился после замены дисков? Похоже что на двух дисках был собран RAID 1, а третий был для бэкапов. Как думаете есть возможность запустить винду с одного диска? Я его подключал отдельно к компу, он живой на нём системные файлы и пакпи.

  23. Иван Семин автор

    Добрый день, при загрузке можно попасть в bios подобное меню LSI и посмотреть какой рейд у вас был.
    Вероятнее всего был RAID0, так как RAID-1 это зеркало и при выходе одного диска остался бы жить. Третий диск видимо забыли использовать, хотя могли сделать как hot swap.
    Срок поставки зависит от уровня поддержки, мне в среднем за 3-4 дня рабочих приходят.
    А при загрузке W ошибки какие на экране появляются?

  24. Iwan

    Зашёл в биос, действительно RAID0 был. Значит придётся винду переустанавливать. Не понимаю для чего на сервере RAID0 делать.

  25. Иван Семин автор

    Видимо, человек создававший его не знал принципов его работы и какой он отказоустойчивый:)

  26. Iwan

    Сегодня из IBM привезли жёсткий диск, буду восстанавливать работоспособность сервера. Сделаю RAID1 вместо RAID0.

  27. Иван Семин автор

    Мудрое решение, успехов.

  28. МихаилК

    Добрый день!
    контроллер LSI 5110e. RAID10 на 6 дисках.

    Намедни получил почтой предупреждение о «Predictive Failure Count»
    Посмотрел в MSM а также поэкспериментировал с CLI
    Drive /c0/e252/s0 State :
    Shield Counter = 0
    Media Error Count = 11
    Other Error Count = 0
    Drive Temperature = 33C (91.40 F)
    Predictive Failure Count = 5
    S.M.A.R.T alert flagged by drive = Yes
    SN = 6XR3H3PF0000M228GXJ5
    Model Number = ST9600205SS
    Хотя состояние RAID все еще optimal.

    Естественно такая модель уже не продается, можно ли закупить аналогичный по характеристикам винт на замену сбойному?

  29. Иван Семин автор

    поидее можно, но там должно быть одинаковое количество байт в диске

  30. МихаилК

    Да, поставил аналогичный. все прошло нормально. Ребилд автоматически запустился и отработал за полтора часа.

  31. Иван Семин автор

    Ларчик как говорится просто открывался, видимо он FRU как то использует.

  32. Александр

    Добрый день!
    Планируется лиликбез по замене BBU на Raid ?

  33. Иван Семин автор

    Добрый, а что у вас за рейд и контроллер и что именно интересует?

  34. Александр

    IBM System x3630 M3 с контроллером ServeRAID M5015, как физически установить разобрался. Больше интересует какие могут быть подводные камни. На что перед заменой надо обратить внимание.

  35. Иван Семин автор

    Да по идее их нет, создаете рейд и мониторите потом его на ошибки, если что меняете диски, все как то так.

  36. Александр

    Наверно имели ввиду батарею на рейде менять в случае ошибок. Спасибо!

  37. Александр

    Приветствую! Имеется сервер IBM X3650 M4, контроллер M5110e. Вышел из строя один диск в raid1. Поставщики нашли такой же и доставили. Старый диск я извлёк из корзины при работающем сервере, новый установил. В программу MSM этот диск отобразился со статусом Unconfigured good. Но ребилд не начинался автоматом.
    После этого в контекстном меню нового диска выбрал «Assign Global Hot Spare», но и после этого ребилд не начался.
    Сейчас ситуация как на скриншоте, новый диск постоянно мигает оранжевым светодиодом (уже 14 часов). Если это идёт ребилд, то почему в MSM на вкладке Dashboard в Background operations пусто?
    Не пойму, что я сделал не так и что мне делать дальше? Как запустить ребилд из под винды, чтобы не тормозить работу?

  38. Иван Семин автор

    Я бы посоветовал вам установить megacli или storecli, посмотреть статусы там http://pyatilistnik.org/storcli-komandyi-upravleniya-raid-kontrollerom-lsi-v-vmware-esxi-5-5/ Так же советую попробовать сделать modify grive group через контекстное меню

  39. Андрей

    Добрый вечер, есть сервер IBM X3500 M4, RAID 50 из 6 Sas дисков, контроллер М5110. Сегодня на сервере загорелась желтая лампочка с восклицательным знаком и с картинкой БД. Сразу стал смотреть, все диски мигают только зеленой лампочкой. Зашел в MegaRaid Storage Manager на одном диске Media Error Count = 1. На втором Media Error Count = 809, Pred Fail Count = 1. Также в Megaraid все диски на данный момент в нормальном состоянии, как лучше поступить? Есть запасной не родной диск. Стоит ли его вставлять на замену диску с ошибками?

  40. Иван Семин автор

    Если запасной подходит по разметки (Размеру), то можете попробовать, если есть сервисный контракт, то пишите в саппорт.