Помощь в восстановлении Raid массива 5 в Пятигорске

На страницах своего сетевого дневника я неоднократно высказывал свое мнение о таком явлении в современной IT индустрии, как сисадмин. Чем больше мне приходится прямо или косвенно сталкиваться с сисадминами, тем более крепнет во мне уверенность, что сисадмин отличается от рядового пользователя полным отсутствием мозгов в черепной коробке, руками произрастающими из задницы и патологической ленью и нежеланием работать.

Собственно, я не одинок в своем мнении. Буквально сегодня мой знакомый — руководитель небольшой компьютерной фирмы сказал — "Когда я беседую с соискателями работы и слышу от претендента, что он имеет опыт работы сисадмином, это сразу 'минус один в карму', одномоментно!"

Ну и вот, не успел изгладиться из памяти сервер Газпрома, как в работу поступил SCSI Raid сервер Aquarius работавший в отделении Фонда социального страхования города Пятигорска. Ситуация самая рядовая для предприятия, в котором наняли на работу сисадминов вместо толковых граждан. Рэйд массив 5-го уровня из четырех дисков в котором давно "отвален" из массива один винчестер. Т.е. мигает красный индикатор, в БИОСе при загрузке сообщения о работе raid массива в критическом режиме, но никто и не чешется. Все как обычно, вобщем, даже и не удивляюсь. Разумеется в таком режиме сервер работает не дни, и не недели даже, а месяцами! Не удивлюсь, что сервера под управлением сисадминов могут быть в запущенном состоянии и годами.

SCSI Raid сервер

Разумеется, в один из дней, вылетает еще один диск и массив разваливается. Что делать? Принимается антикризисное решение, брать сервер в охапку и ехать к товарищам-сисадминам из головного офиса.

Общеизвестно, что одна голова хорошо, а две — лучше. Но эта сермяжная истина дает сбой, когда речь идет о головах сисадминов.

Встретившись под сенью головного офиса админы приступили к процессу спасения баз данных предприятия. Перво-наперво вынули и вставили все диски назад. Потом собрали в SCSI Raid BIOS рэйд массив и попытались загрузиться с него. Вывалилось сообщение о сбое в системных файлах Windows. Загрузились с CD — оба раздела видны, но неотформатированы.

Типичная картина для неправильно собранного рэйда, когда часть блоков массива валидна, а часть нет. В этой бы ситуации для восстановления данных массив пересобрать надо. С другими параметрами. Причем делать это разумеется надо на копиях, а не на дисках-оригиналах. Но наш сисадмин не таков! Неразмеченный раздел? Так мы его разметим! Отформатируем и поставим на него винду. Потом запустим чекдиск, чтобы поправить раздел с базой и бэкапами (у настоящих сисадминов бэкапы кладутся на тот же HDD, в другую папку). Потом поставить EasyRecovery и убедиться, что все восстановленное неработоспособно. Архивы при распаковке дают ошибку CRC, базы данных не запускаются.

Когда raid array попал ко мне, то картина предстала моему взору безрадостная. В файловую систему внесены правки, основанные на некорректно собранном рейде, на неверно собранный раздел записались файлы с расширением .chk и все в таком духе.

На анализ и восстановление информации с этого массива у меня ушло два дня. В результате удалось поднять последние архивные копии базы данных и помочь Пятигорчанам.

Хорошие они люди, сисадмины. На работу таких брать — рекомендую.