Не загружаются blade в IBM BladeCenter после аварии с электричеством

Не грузятся blade в IBM BladeCenter после аварии с электричеством-01

Всем привет сегодня хочу поделиться опытом когда не загружаются blade в IBM BladeCenter после аварии с электричеством. Опишу ситуацию и схему работы системы. Есть NetApp который отдает свои lun ibm блейдам HS22 по протоколу FC через fc broadcade свитчи, на blade настроена загрузка boot from san,  и вот в один прекрасный день большой UPS APC в 20 киловатт выходит из строя и вся стойка с этим добром отваливается. После восстановления электричества работает все кроме блейдов, точнее они работают но не загружаются и уходят в вечную перезагрузку с иницилизацией.

Сразу хочу отметить что broadcade свитчи и Lun на NetApp были в рабочем состоянии. Первое что нужно проверить это зайти в BIOS blade hs22, сделать это можно с помощью встроенного kvm в Remote ControlПосле инициализации вам предложат нажать F1 для попадания в setup. Переходим в пункт System Settings

Не загружаются blade в IBM BladeCenter после аварии с электричеством-01
Не загружаются blade в IBM BladeCenter после аварии с электричеством-01

Далее в Emulex Configuration Utility Ver:4.12X2

Не загружаются blade в IBM BladeCenter после аварии с электричеством-02
Не загружаются blade в IBM BladeCenter после аварии с электричеством-02

переходим в единственный пункт Emulex Configuration Setup Utility

Не загружаются blade в IBM BladeCenter после аварии с электричеством-03
Не загружаются blade в IBM BladeCenter после аварии с электричеством-03

Выбираем любой из адаптеров

Не загружаются blade в IBM BladeCenter после аварии с электричеством-04
Не загружаются blade в IBM BladeCenter после аварии с электричеством-04

Видим статус RECONNECT DEVICES, делаем Scan for Fibre Device

Не загружаются blade в IBM BladeCenter после аварии с электричеством-05
Не загружаются blade в IBM BladeCenter после аварии с электричеством-05

И видим, что Link is Down, в большинстве случаев это проблема с I/O Module Configuration

Не загружаются blade в IBM BladeCenter после аварии с электричеством-06
Не загружаются blade в IBM BladeCenter после аварии с электричеством-06

Переходим в снова в наш IBM BladeCenter нас будет интересовать пункт I/O Module Tasks

Не загружаются blade в IBM BladeCenter после аварии с электричеством-07
Не загружаются blade в IBM BladeCenter после аварии с электричеством-07

I/O Module это модуль для управления fc портами с блейд центра.  С помощью него можно смотреть статистику сетевого трафика на каждый блейд и много других полезных вещей. Так как у нас пропадало электричество то порты на I/O Module могли зависнуть либо модуль вообще не включился. Включить I/O Module можно в пункте Available actions. Еще полезным будет нажать view, благодаря этому мы узнаем ip адрес веб интерфейса для управления FC портами.

Не загружаются blade в IBM BladeCenter после аварии с электричеством-08
Не загружаются blade в IBM BladeCenter после аварии с электричеством-08

Вот список команд по работе с I/O Module

Не загружаются blade в IBM BladeCenter после аварии с электричеством-09
Не загружаются blade в IBM BladeCenter после аварии с электричеством-09

Вот как будет выглядеть информация об ip адресе веб интерфейса

Не загружаются blade в IBM BladeCenter после аварии с электричеством-10
Не загружаются blade в IBM BladeCenter после аварии с электричеством-10

Обратившись по этому адресу у вас откроется окно со вводом логина и пароля

Не загружаются blade в IBM BladeCenter после аварии с электричеством-11
Не загружаются blade в IBM BladeCenter после аварии с электричеством-11

Стандартный логин и пароль I/O Module это USERID/PASSW0RD.

Не загружаются blade в IBM BladeCenter после аварии с электричеством-12
Не загружаются blade в IBM BladeCenter после аварии с электричеством-12

Перед нами открывается switch для управления fc портами IBM BladeCenter.

Не загружаются blade в IBM BladeCenter после аварии с электричеством-13
Не загружаются blade в IBM BladeCenter после аварии с электричеством-13

Давайте посмотрим карту портов, идем в пункт меню Port-Map Ports

Не загружаются blade в IBM BladeCenter после аварии с электричеством-14
Не загружаются blade в IBM BladeCenter после аварии с электричеством-14

Вот так вот приблизительно у вас должна выглядеть карта портов, один основной и второй запасной.

Не загружаются blade в IBM BladeCenter после аварии с электричеством-15
Не загружаются blade в IBM BladeCenter после аварии с электричеством-15

Если у вас какие то из портов красные значит они offline, для включения их выберем нужный порт и в верхнем меню переходим в пункт Port-Port Properties

Не загружаются blade в IBM BladeCenter после аварии с электричеством-16
Не загружаются blade в IBM BladeCenter после аварии с электричеством-16

И выставляем чтобы порт был в статусе online.

Не загружаются blade в IBM BladeCenter после аварии с электричеством-17
Не загружаются blade в IBM BladeCenter после аварии с электричеством-17

Так нужно проверить все порты, после чего все ваши блейды успешно загрузятся с Boot from San и работа будет восстановлена.

в BIOS можно проверить что Lun определились.

Не загружаются blade в IBM BladeCenter после аварии с электричеством
Не загружаются blade в IBM BladeCenter после аварии с электричеством

Если нет сети на блейдах

Так же может быть ситуация, что ethernet свитчи, тоже переведут порты управления в состояние DOWN, их нужно включить. Их должно быть два, ip адреса свитчей можно посмотреть в I/O Module Power.

Логин admin Пароль admin

Переходим в пункт, Dashboard

Сеть ibm bladecenter-4

Далее идем в Switch Ports, у вас будет список портов, убедитесь, что порты int включены.

Сеть ibm bladecenter-1
и самое главное убедитесь, что порты MGT в состоянии включено
Сеть ibm bladecenter-2Если они в offline, то переводим их в online.

Сеть ibm bladecenter-3

Для применения настроек не забудьте нажать Apply > Save

Материал сайта pyatilistnik.org

Оцените статью
Настройка серверов windows и linux
Добавить комментарий

  1. Виталий

    Ситуация.
    Имеется ibm blade center h
    В нем 14 лезвий h21, 2 модуля управления [без com порта, с двумя портами разъема rj45, с двумя usb и одним vga], 2 fc коммутатора, 2 cisco коммутатора. Один из двух blower module неисправен.
    После сбоя электроэнергии blade center h при включении питания запускает только рабочий blower module, передние модули с кулерами и 2 модуля управления находятся в состоянии включено, но без определения главного из них (горят только светодиоды подачи питания на модули управления и идет постоянное включение/отключение сети на порту ethernet). Лезвия не включаются при нажатии на их кнопку.
    Как запустить blade center и можно ли это сделать с одним blower module??
    Спасибо!

  2. Иван Семин автор

    по ssh есть возможность к контроллеру подключиться?

  3. Виталий

    Нет.

  4. Иван Семин автор

    Печально, вам бы по уму вызвать сервисного инженера из IBM, все обесточивать пробовали? Какие есть варианты подключения com порт или еще что-то?

  5. Виталий

    Обесточивали и все вынимали. Он вобщем-то и выключенный стоит, раз не запускается..
    Com порт пробовали, но еще сброс не пробовали.
    Главный вопрос в том, что может это быть из-за того, что в работе один из двух blower module, а второй неисправен?

  6. Иван Семин автор

    Да с 99% вероятностью один из модулей накрылся, и система страхует себя от краха.

  7. Виталий

    Blower module отремонтирован. bladecenter h запускает оба охлаждающих модуля сзади, запускает спереди все вентилирующие блоки, горит светодиод питание и авария.
    На обоих АММ модулях горит только светодиод питание сетевой порт обоих АММ перезапускается каждые 2-3 секунды. На коммутаторы и лезвия питание не подаётся 🙁
    Есть ли решение проблемы или надо смотреть корпус?

  8. Денис

    День добрый. в какой то момент лег свитч l2/l3 cooper на blade s сервере. живет теперь в вечном ребуте, на АММ и веб морды SAS вхожу, но не более того. Работа через java AMM тот еще «секс». Как прошить свитч «кирпич»?

  9. Иван Семин автор

    А, что у вас за шайтан машина?