Выберите Ваш город

Введите название вашего города

  • Абакан
  • Анадырь
  • Арзамас
  • Архангельск
  • Астрахань
  • Барнаул
  • Белгород
  • Биробиджан
  • Благовещенск
  • Брянск

Помощь в восстановлении Raid массива 5 в Пятигорске

Artem Makarov aka Robin
19.06.2009
4258 просмотров

На страницах своего сетевого дневника я неоднократно высказывал свое мнение о таком явлении в современной IT индустрии, как сисадмин. Чем больше мне приходится прямо или косвенно сталкиваться с сисадминами, тем более крепнет во мне уверенность, что сисадмин отличается от рядового пользователя полным отсутствием мозгов в черепной коробке, руками произрастающими из задницы и патологической ленью и нежеланием работать.

Собственно, я не одинок в своем мнении. Буквально сегодня мой знакомый — руководитель небольшой компьютерной фирмы сказал — "Когда я беседую с соискателями работы и слышу от претендента, что он имеет опыт работы сисадмином, это сразу 'минус один в карму', одномоментно!"

Ну и вот, не успел изгладиться из памяти сервер Газпрома, как в работу поступил SCSI Raid сервер Aquarius работавший в отделении Фонда социального страхования города Пятигорска. Ситуация самая рядовая для предприятия, в котором наняли на работу сисадминов вместо толковых граждан. Рэйд массив 5-го уровня из четырех дисков в котором давно "отвален" из массива один винчестер. Т.е. мигает красный индикатор, в БИОСе при загрузке сообщения о работе raid массива в критическом режиме, но никто и не чешется. Все как обычно, вобщем, даже и не удивляюсь. Разумеется в таком режиме сервер работает не дни, и не недели даже, а месяцами! Не удивлюсь, что сервера под управлением сисадминов могут быть в запущенном состоянии и годами.

SCSI Raid сервер

SCSI Raid сервер

Разумеется, в один из дней, вылетает еще один диск и массив разваливается. Что делать? Принимается антикризисное решение, брать сервер в охапку и ехать к товарищам-сисадминам из головного офиса.

Общеизвестно, что одна голова хорошо, а две — лучше. Но эта сермяжная истина дает сбой, когда речь идет о головах сисадминов.

Встретившись под сенью головного офиса админы приступили к процессу спасения баз данных предприятия. Перво-наперво вынули и вставили все диски назад. Потом собрали в SCSI Raid BIOS рэйд массив и попытались загрузиться с него. Вывалилось сообщение о сбое в системных файлах Windows. Загрузились с CD — оба раздела видны, но неотформатированы.

Типичная картина для неправильно собранного рэйда, когда часть блоков массива валидна, а часть нет. В этой бы ситуации для восстановления данных массив пересобрать надо. С другими параметрами. Причем делать это разумеется надо на копиях, а не на дисках-оригиналах. Но наш сисадмин не таков! Неразмеченный раздел? Так мы его разметим! Отформатируем и поставим на него винду. Потом запустим чекдиск, чтобы поправить раздел с базой и бэкапами (у настоящих сисадминов бэкапы кладутся на тот же HDD, в другую папку). Потом поставить EasyRecovery и убедиться, что все восстановленное неработоспособно. Архивы при распаковке дают ошибку CRC, базы данных не запускаются.

Когда raid array попал ко мне, то картина предстала моему взору безрадостная. В файловую систему внесены правки, основанные на некорректно собранном рейде, на неверно собранный раздел записались файлы с расширением .chk и все в таком духе.

На анализ и восстановление информации с этого массива у меня ушло два дня. В результате удалось поднять последние архивные копии базы данных и помочь Пятигорчанам.

Хорошие они люди, сисадмины. На работу таких брать — рекомендую.

Оставьте комментарий
Владислав
19 июня 2009, 15:51

Ниачём. Здесь, на задворках Россиянии ни в одной сфере созидательной деятельности не наблюдается скопления людей, которым свойственны интеллект и профессионализм. Почти все, кто портил эту картину, давно уехали искать лючшей доли...

zloe
20 июня 2009, 19:57

не верю. ну не верю я что везде сисадминами работают такие долпойопы :)

Artem Makarov aka Robin
21 июня 2009, 18:28

И правильно делаете! Конечно не везде! Кое-где работают такие граждане, к которым термин «долбойоп» можно применить только в качестве похвалы.

Шилин Павел
21 июня 2009, 22:58

Сисадмин. У меня в конторе на столе начальника - толстая пачка заявок на материалы-комплектуху. И? Хорошо лежит. Что не отменяет наличия баранов где угодно.

Sonya
22 июня 2009, 15:02

Вот только обобщать не надо! Неадекватных людей везде хватает, в том числе в области датарекавери: - полетел рейд, классическое зеркало из двух винтов по 640Гб. Отдали в контору в Москве. Да, они восстановили данные, но взяли 20000р. Как потом выяснилось, там просто сковырнули трансил на одном из дисков, рейд завёлся и данные просто скопировали. Но это не значит, что все криворукие. И среди сисадминов есть нормальные и ответственные люди.

Tigger
04 сентября 2012, 16:13

Дать бы тебе по шее за поклёп. Того админа, которого ты описал, гнать надо в 3 шеи. Ибо ХРЕНОВЫЙ он админ. За тянучку с заменой винта, за отсутствие бэкапов, и за отсутствие мозгов при последовавших действиях. Нормальный админ прекрасно понимает, что подобным образом рассыпавшимся рэйдом (раз уж он рассыпался) надо обращаться так же аккуратно, как сапёру с миной. P.S. К слову, полетевшие ОДНОВРЕМЕННО 2 винта в 5-м рэйде - не такая уж большая редкость. На моей памяти было 2 случая. В обоих случаях почти все данные удалось спасти, ибо в обоих случаях один винт сдыхал полностью, а другой - не совсем.

IT Консультант
13 ноября 2018, 22:44

Немного некропостии)))
На ваш ресурс наткнулся только что, так что если повтор, то не обижайтесь)))
Вы просто не представляете, как идет работа в госконторах… и газпром — практически госконтора (отличий немного со слов знакомых, кто там работает).
Вылетел диск — ты к своему руководителю, тот — пиши служебку на главного «так и так, все скоро рухнет, срочно нужна замена». И да, хотспар бюджетом изначально не предусмотрено))). А уж если твой начальник вдруг не понимает суть проблемы, то вообще ппц («а что — работает же»), благо, что у меня не такой :-)
Далее эта служебка начинает свой адовый круг по миллиону ведомств, ибо бюджет на год уже сверстан, а потенциальные запчасти исходно никого не волновали, ибо экономия бюджета. И ладно, если у конторы свое собственное обеспечение, там чуть проще, а то бывает и внешнее, когда все, что нужно, предоставляется другой госконторой, от тебя независящей от слова совсем… Я выбивал запчасти (те же винты) самое быстрое (у нас тоже внешнее снабжение) за полгода, самое длительное — за два. И для обоснования быстрого снабжения нужно написать обоснование аля «сказку», как из-за полного писеца у нас встанет супер-пупер система, из-за чего люди могут выйти на улицы и начать перекрывать федеральные трассы. Вот такая хня, малята...((
А вот за дальнейшие (по тексту) потуги горе-одминов конечно нужно руки вырывать из плеч и пришивать в жопу, где им и самое правильное место))) Во всяком случае для нормального админа из _образов_ побитых дисков (пока они хоть как-то читаются по одиночке) выдрать нужные файлы (если именно они не побиты физически) больших проблем не представляет (если конечно есть, куда сохранить эти образа, как и нужные для таких случаев бэкапы — см. про бюджет и снабжение)… доступного софта вагон)))) У меня диски успевали прийти (пока что), чтоб массивы успели ребилдиться, но это тоже треш — приходишь утром и смотришь — еще живой массив или уже опа, а замены все нет и нет, и когда прибудет — неизвестно, особенно когда это ссд в рейде, которые мрут обычно _почти_ одновременно....(((

Нужна консультация?

Мы одна из немногих лабораторий в России, которая восстанавливает данные самостоятельно.

Для этого у нас есть все необходимое:
Важно – кто будет первым!
восстанавливать
информацию