Как запросить замену диска в сервере у IBM
Добрый день уважаемые читатели блога, сегодня хотел бы поделиться опытом как запросить замену диска в сервере у IBM. Ни для кого не секрет, что работа серверов 24/7, через несколько лет начинает косить винты, в один из прекрасных дней вы придя на работу услышите писк из серверной, и начав разбираться увидите, что пищит сервер IBM. На самом сервере в районе винтов вы увидите, что на одном или не дай Бог нескольких винтах горит желтая лампочка.
Как запросить замену диска в сервере у IBM-011Она сигнализирует, что диск в данном RAID массиве вышел из строя. В некоторых случаях он еще не умер, а просто валился из RAID, для начала просто его вытащите и снова воткните, если через некоторое время лампочка продолжает гореть то приступаем к следующему шагу. Да еще хотел отметить, что посмотреть статус RAID в сервере IBM, можно утилитой MSM.
Заходим в нее и видим, что на вкладке Physical у нас один из винтов красного цвета, это значит что он все вышел из строя, намертво.
После, этого нам нужно обратиться в тех поддержку компании IBM, и собрать для них логи. Как собрать логи утилитой DSA читайте тут. Так же на каждом сервере вам нужно записать его MTM, SN и Product ID, найти их можно слева от винтов, еще техническая поддержка может вас попросить выслать ibm fru номер жесткого диска.
После сбора логов отправляем письмо в техническую поддержу, по адресу
Далее ждем когда приедет курьер и привезет диски. Заменяем их на убитые HDD и начинается процесс Rebild в RAID.
Наблюдать его статус можно через MSM утилиту.
и также можно посмотреть сколько по времени это займет, на главной странице утилиты вы увидите ползунок
Нажав More details вы увидите более подробную информацию
Надеюсь данная статья вам помогла и вы сэкономили немного времени и нервных клеток. Материал сайта pyatilistnik.org
Добрый день. Подскажите пож-та, сейчас у меня рейд в статусе разрушен, один диск вылетел, установил новый (той же серии) но ни чего не происходит. Желтая лампочка при этом не горит и не горела, ни на самом диске ни на панели. Может быть надо где настроить, что бы горела желтая лампочка? Server X3300 M4, диски не родные (не IBM). Спасибо
Сергей, первое что нужно сделать это поставить программу управления RAID контроллером, если у вас LSI то ставим MSM http://pyatilistnik.org/kak-ustanovit-megaraid-storage-manager-msm-v-windows-server-2012r2/ если adaptec то ставим ASM http://pyatilistnik.org/kak-ustanovit-adaptec-storage-manager/
зайдя внутрь, можно посмотреть как видится новый диск контроллером, и принудительно сказать rebuild и как минимум посмотреть лог файл.
А могли бы вы подсказать точно модель контроллера
Спасибо за скорый ответ. Модель контроллера M1115. В моем случае меня интересует почему не горят желтые лампочки на самом диске и на панели сверху? Спасибо еще раз
а в каком статусе у вас видится в MSM ваш новый диск и какой статус RAID?
MSM пока не установил еще, в Megaraide диск был красным цветом, а рейд кажется в статусе разрушен (вроде бы так)
Нужно посмотреть с помощью MSM, статусы и логи так быстрее можно понять проблему, либо можно логи снять утилитой MEGACLI, но MSM нагляднее все показывает
проблем после установки MSM не было? у меня сейчас сервер работает, 200 чел онлайн
все установил MSM, Диск 6 — unconf good, Virtual drive — Degraded.
_ttps://drive.google.com/file/d/0B6eEbnHYQfeBZWxlSTlHQm81YXc/view?usp=sharing
_ttps://drive.google.com/file/d/0B6eEbnHYQfeBY1RjSVNkdWJPOGM/view?usp=sharing
установил, один диск — Unconfig good, Virtual drive — Degraded
_ttps://drive.google.com/file/d/0B6eEbnHYQfeBZWxlSTlHQm81YXc/view?usp=sharing
_ttps://drive.google.com/file/d/0B6eEbnHYQfeBY1RjSVNkdWJPOGM/view?usp=sharing
установил, один диск — Uncofig good, Virtual drive — degraded.
Хотел ссылку на скрин скинуть суда, не получается
Сделайте его правым кликом Online если такого нет то попробуйте его сделать как Assign Global Hot Spare
И покажите ещ пож скрин с dashboard
Я произвел на тестовом, после Assign Global Hot Spare должен начаться ребилд
_ttps://drive.google.com/file/d/0B6eEbnHYQfeBa0N2UWdMV1J5NXc/view?usp=sharing
После ребилда я не потеряю инфу? Переживаю! может быть после бэкапа сделать?
Если вы его не сделаете то потеряете, ребилд это стандартная операция восстановления RAID, которая перекидывает дублирующая информацию на hdd дублер.
ночью на всякий случай сделаю бэкап, а после все что Вы писали! Спасибо! А на счет желтых индикаторов не подскажите почему не горят?
индикатор загорится как только начнется ребилд, сейчас диск находится в подвешенном состоянии ни туда ни сюда, отпишитесь пож как у вас все пройдет
Хорошо! Спасибо!
пока еще не делал, в это воскресенье буду делать. Просьба не удалять статью и комментарии. спасибо
Добрый день. Сделал как Вы писали Asifn Global Hot Spare, начался ребилд. Сейчас работает как надо, спасибо большое за помощь!!!
рад что мой опыт вам помог и вы научились чему то новому
Иван, помогите советом, если есть возможность ответить.
У нас на сервере IBM System x3400 M3 Server -7379ZLP полетел один жёсткий диск. Проверили документы, оказалось, что уже не гарантийный. Сервер вообще не загружался (даже БИОС не грузил), просто чёрный экран. Вытащили все три диска, поставили три новых диска, но не фирмы IBM, БИОС загрузился. Стали думать как был сконфигурирован RAID, контроллер LSI, поддерживающий только RAID 0,1, и 10, а диска всего три. Стали звонить в техподдержку фирмы, где приобретали, они посоветовали позвонить всё же в IBM и уточнить на счёт гарантии, позвонили, оказывается наш сервер ещё гарантийный, вытащили новые диски, вставили старые, БИОС сервера загрузился, собрали логи для IBM, они обещали выслать один новый жёсткий диск, но по срокам пока не понятно, когда придёт. БИОС загрузился, но винда не загружается. Наш RAID получается развалился после замены дисков? Похоже что на двух дисках был собран RAID 1, а третий был для бэкапов. Как думаете есть возможность запустить винду с одного диска? Я его подключал отдельно к компу, он живой на нём системные файлы и пакпи.
Добрый день, при загрузке можно попасть в bios подобное меню LSI и посмотреть какой рейд у вас был.
Вероятнее всего был RAID0, так как RAID-1 это зеркало и при выходе одного диска остался бы жить. Третий диск видимо забыли использовать, хотя могли сделать как hot swap.
Срок поставки зависит от уровня поддержки, мне в среднем за 3-4 дня рабочих приходят.
А при загрузке W ошибки какие на экране появляются?
Зашёл в биос, действительно RAID0 был. Значит придётся винду переустанавливать. Не понимаю для чего на сервере RAID0 делать.
Видимо, человек создававший его не знал принципов его работы и какой он отказоустойчивый:)
Сегодня из IBM привезли жёсткий диск, буду восстанавливать работоспособность сервера. Сделаю RAID1 вместо RAID0.
Мудрое решение, успехов.
Добрый день!
контроллер LSI 5110e. RAID10 на 6 дисках.
Намедни получил почтой предупреждение о «Predictive Failure Count»
Посмотрел в MSM а также поэкспериментировал с CLI
Drive /c0/e252/s0 State :
Shield Counter = 0
Media Error Count = 11
Other Error Count = 0
Drive Temperature = 33C (91.40 F)
Predictive Failure Count = 5
S.M.A.R.T alert flagged by drive = Yes
SN = 6XR3H3PF0000M228GXJ5
Model Number = ST9600205SS
Хотя состояние RAID все еще optimal.
Естественно такая модель уже не продается, можно ли закупить аналогичный по характеристикам винт на замену сбойному?
поидее можно, но там должно быть одинаковое количество байт в диске
Да, поставил аналогичный. все прошло нормально. Ребилд автоматически запустился и отработал за полтора часа.
Ларчик как говорится просто открывался, видимо он FRU как то использует.
Добрый день!
Планируется лиликбез по замене BBU на Raid ?
Добрый, а что у вас за рейд и контроллер и что именно интересует?
IBM System x3630 M3 с контроллером ServeRAID M5015, как физически установить разобрался. Больше интересует какие могут быть подводные камни. На что перед заменой надо обратить внимание.
Да по идее их нет, создаете рейд и мониторите потом его на ошибки, если что меняете диски, все как то так.
Наверно имели ввиду батарею на рейде менять в случае ошибок. Спасибо!
Приветствую! Имеется сервер IBM X3650 M4, контроллер M5110e. Вышел из строя один диск в raid1. Поставщики нашли такой же и доставили. Старый диск я извлёк из корзины при работающем сервере, новый установил. В программу MSM этот диск отобразился со статусом Unconfigured good. Но ребилд не начинался автоматом.
После этого в контекстном меню нового диска выбрал «Assign Global Hot Spare», но и после этого ребилд не начался.
Сейчас ситуация как на скриншоте, новый диск постоянно мигает оранжевым светодиодом (уже 14 часов). Если это идёт ребилд, то почему в MSM на вкладке Dashboard в Background operations пусто?
Не пойму, что я сделал не так и что мне делать дальше? Как запустить ребилд из под винды, чтобы не тормозить работу?
Я бы посоветовал вам установить megacli или storecli, посмотреть статусы там http://pyatilistnik.org/storcli-komandyi-upravleniya-raid-kontrollerom-lsi-v-vmware-esxi-5-5/ Так же советую попробовать сделать modify grive group через контекстное меню
Добрый вечер, есть сервер IBM X3500 M4, RAID 50 из 6 Sas дисков, контроллер М5110. Сегодня на сервере загорелась желтая лампочка с восклицательным знаком и с картинкой БД. Сразу стал смотреть, все диски мигают только зеленой лампочкой. Зашел в MegaRaid Storage Manager на одном диске Media Error Count = 1. На втором Media Error Count = 809, Pred Fail Count = 1. Также в Megaraid все диски на данный момент в нормальном состоянии, как лучше поступить? Есть запасной не родной диск. Стоит ли его вставлять на замену диску с ошибками?
Если запасной подходит по разметки (Размеру), то можете попробовать, если есть сервисный контракт, то пишите в саппорт.