История успеха, немного по мотивам А вот хочу RAID на Proxmox, например. .
Решил таки пойти по простому пути и поставить на proxmox md, чтобы не париться с переносом данных.
Акт I
Взял массив с фоточками, воткнул его в nas на горячую (что я, лох что ли, гасить гипервизор, когда железо hot plug поддерживает), mdraid автоматом его подцепил, фоточки смонтировались. Здорово, - подумал я, - линукс и вправду с человеческим лицом.
Акт II
Через некоторое время захотелось накатить™. Сначала прогнал апдейт на тестовой железке, всё ок. Обновил основную коробку, в которую воткнут массив с фоточками. После ребута коробка ехидно на связь не вышла, упав в консоль GRUB.
Ладно, дурное дело не особо хитрое. Лайвсили, чрут, установка загрузчика на системный ssd. Не впервой.
После загрузки меня ожидала следующая картина:
-
диск 0 - отформатирован в MBR, создан один раздел неизвестного типа на всю ёмкость
-
диск 1 - linux raid, всё ок
-
диск 2 - отформатирован в GPT, опаньки, потерянный boot раздел нашёлся, затерев первый гигабайт ^_^
Ну вы поняли, ахахах. 2 из 3 томов RAID 5 попячены, наслаждайся своей половиной данных, нашинкованных по 512K.
Акт III
Снял с этого позорища резервные копии. Пожалуй, это было единственным однозначно верным решением.
Так, смотрим. Данные на дисках физически есть, strings находит текстовики, которые там были. Теоретически, в такой ситуации достаточно было взять диски 0 и 1, как наименее повреждённые, и пересоздать на них массив с теми же характеристиками, скрестить пальцы и вычитать данные, указав резервный суперблок ext4. Но нифига - несмотря на ту же версию метаданных и порядок дисков, никакое из сочетаний не давало живой ФС на выходе.
В итоге пришлось гуглить гуглы, качать проприетарную r-studio, ЧИТАТЬ МАНУАЛ и почти целый день ждать, пока она соберёт образ из повреждённого массива. Что удивительно, результат сборки сразу смонтировался, и даже по мнению fsck оказался вполне приемлемым. Фоточки спасены. Happy end.
Эпи-нафиг-лог.
Было потрачено 4 дня времени и 15к на диск под промежуточные операции. Оверпрайсный диск останется у меня, а вот времени жалко.
Конторы восстановления данных, когда видят RAID, сразу чувствуют много 🤑, причём умножают сумму на число дисков. Физикам пользоваться их услугами вообще не вариант, если не вопрос жизни и смерти.
Что было сделано не так?
Стратегически - отсутствие бэкапа.
Технически? Наверное, можно выделить
-
выпендрёж с горячим подключением консьюмерских железок
-
применение неподдерживаемого массива
-
возможно - использование прямой установки RAID на диск, а не в раздел
-
вероятно, я накосячил при восстановлении загрузчика, усугубив ситуацию os-prober’ом, хоть и не понимаю, зачем и как именно
Надеюсь, моя рождественская история вас позабавила. Цветы и деньги складывайте в машину, офигенные советы можно постить в комментариях.
Перемещено hobbit из general












