LINUX.ORG.RU
ФорумAdmin

Что делали целых 20 лет линуксятники с RAID1?

 


0

5

Сегодня хочется публично поматерится, т.к. других слов просто не находится.

Предыистория.
Есть у меня один простенький дедик. Ввиду простоты использую на нем программный RAID1, большего и не требуется.
Лет 5 назад с трудом собрал его по совершенно идиотским инструкциям.
Идиотским - потому что ни одна из инструкций, рассыпаных в Инете, на друг друга не похожи, каждый «афтор» внес свою «посильную лепту» и в результате все эти инструкции описывают рутинную сборку одного и того же RAID1 по разному, и какая их них правильная - хз.
Но все же кое-как удалось собрать этот рейд, и 5 лет он честно проработал.

Для чего вообще я собрал этот рейд? Разумеется, надеясь, что он повысит отказоустойчивость сервера.

И вот, то, что когда-то должно было произойти, свершилось: недавно на одном диске SMART обнаружил BAD-блоки, как гарантии серверных дисков исполнилось 5 лет, на одном диске SMART обнаружил растущие BAD-блоки.
Решил поменять его на резервный ДО того, как он окончательно грохнется.
Сначала расцепил RAID, потом размонтировал разделы на битом диске, короче, сделал все по науке - если считать «наукой» эти опять же разные инструкции по этой процедуре.
Затем сменил битый диск, попытался загрузиться - а фиг вам!
Сначала вроде грузится, показывает загрузчик, а потом идет ругань на неправильный имидж.
Но этот же один исправный диск должен запуститься один, самостоятельно, вне зеркала!
Пришлось пока снова вернуться на битый диск.

Вопрос: и на кой тогда вообще этот программный RAID1 в Linux??
По идее, он должен повысить отказоустойчивость дисковой системы, причем - автоматически.
Но какое же тут повышение, если, во-первых, при отказе одного из дисков система тут же перестает работать,
а во-вторых, чтобы восстановить её работоспособность, нужен ручной труд, причем - квалифицированный?
По правильным инструкциям и т.д. Но по любому, автоматизма здесь - НЕТ!

Для сравнения: вспоминаю старые времена, когда имел дело еще с NT4.
И вот, уж тогда в этой системе, ныне называющейся древней, чтобы собрать зеркало, нужно было всего лишь кликнуть мышкой на нужном диске, откинуться на спинку стула и попивать кофеёк - потому что дальнейшая сборка происходила автоматически, и система при этом даже выполняла основные задачи, хотя и немного медленнее.
Если происходил сбой зеркала, вмешательство админа не требовалось -система его собирала автоматически!
Более того - если один из дисков склеил ласты, то система продолжала работать на одном!
И достаточно было сменить битый диск, как он автоматически собирался в зеркало!

NT4 была создана еще в далеком в 1996.
Сейчас 2016 год, и всего этого в «RAID1 от Linux» - до сих пор нет!
Спрашивается - что делали 20 (двадцать, Карл!) грёбаные линуксятники, именующие себя «разработчиками»?!
Не иначе, как х$м груши околачивали.

★★★★

Вот потому и платят деньги системным администраторам. Я поражаюсь: человек вместо чтения документации читает какие-то инструкции в инете от васи и поражается что ничего не работает. Сделай modprobe brain чтоли..

Deleted ()

Вижу полное незнание матчасти и, что самое прискорбное, нежелание её (матчасть) знать. Полагаю NT4 для Вас самое то.

King_Carlo ★★★★★ ()

потом идет ругань на неправильный имидж

Сходи к стилисту, пусть зделает правильный имидж.

anonymous ()
Ответ на: комментарий от King_Carlo

NT4 - да, самое то. А еще 2000, 2003, 2008 и т.д. - поддерживается полная автоматизация!

Но вы не ответили на главный вопрос - см. название темы!

chukcha ★★★★ ()

Я не знаю что ты у себя настроил, но в линуксе рейд1 работает так:

RAID1: OK - [UU]
RAID1: Disk fail - [_U]
система продолжает работать на RAID1 Degraded и пинает тебя по email: чувак, пора хард менять!
Admin: mdadm --manage /dev/md* --fail /dev/sda*
Admin: mdadm --manage /dev/md* --remove /dev/sda*
Admin: вынуть битый хард, поставить новый
Admin: sfdisk -d /dev/sdb | sfdisk /dev/sda
Admin: mdadm --manage /dev/md* --add /dev/sda*
RAID1: rebuild [====>...UU]
RAID1: OK [UU]

BaBL ★★★★★ ()
Ответ на: комментарий от chukcha

То есть в том, что ты баран виноват кто-то кроме тебя? Я тебе тайну открою: под виндой рейд софтовый вообще страшная вещь. Но ты не расстраивайся, тебе вряд ли доверят серьезные системы.

Deleted ()
Ответ на: комментарий от chukcha

Вопрос, чем занимался ты 5 лет, если до сих пор все делаешь по «идиотским инструкциям», не разбираясь в матчасти.

Deleted ()
Ответ на: комментарий от dk-

Да, это достижение в стиле ЛОРа - вместо того, чтобы дать ответ на ЕДИНСТВЕННЫЙ вопрос - переход наличности и обсирание.
Значит - ответа на простой вопрос у вас, господа нет? А есть только дерьмо в карманах?

chukcha ★★★★ ()
Ответ на: комментарий от Deleted

Ты еще не ответил на мой вопрос, а уже суешься с своим

chukcha ★★★★ ()
Ответ на: комментарий от chukcha

Значит - ответа на простой вопрос у вас, господа нет?

На идиотский вопрос, нет. mdadm работает давно и без сюрпризов, тут не о чем говорить.

А есть только дерьмо в карманах?

На большее ты не наработал.

futurama ★★★★★ ()
Ответ на: комментарий от chukcha

Тебе выше уже всё расписали. Чего ты еще хочешь?

Deleted ()
Ответ на: комментарий от chukcha

Лично у меня ответа на твой вопрос нет ввиду моей около нулевой квалификации в линуксах. Хотя и сам «админю» сервер под свой сайт.

Но меня поражает тот факт, что ты вместо чтения мануала начал собирать рецепты от нонейм васянов. Это очень странный подход.

dk- ()
Ответ на: комментарий от chukcha

Что делали целых 20 лет линуксятники с RAID1?

Хорошо, читаю название темы. Хотя, лично я, считаю mdadm уже слегка устаревшим инструментом, я, в то же время, считаю его самым безглючным и надежным среди всех возможных вариантов soft-raid. Отвечаю на вопрос из названия темы - линуксятники сделали лучший в мире soft-raid, но не сделали кнопку - «сделать за.бись».

King_Carlo ★★★★★ ()
Последнее исправление: King_Carlo (всего исправлений: 2)

Господа, вы тут можете еще 20 страниц обсирать меня, это вы, конечно, умеете и этого у вас не отнять.
Но когда вам это занятие надоест - просьба ответить на ЕДИНСТВЕННЫЙ мой вопрос.

Заодно подумайте, почему Linux попрежнему занимает 1%.
Не потому ли, что вы не умеете отвечать на вопросы, помогать и принимать справедливую критику?
Фанатизм - штука нехорошая, она линуксу только вредит, если вы не знали.

chukcha ★★★★ ()
Ответ на: комментарий от chukcha

Нормально так жира натекло с ноутбука. Пойду пирожки жарить.

Deleted ()

Кекеке, ну ты даёшь. Тебе 10 лет что ли? Кто вообще этот шлак читает в интернете, оно же написано вообще нулевыми людьми как правило. Если ты не понимаешь, что делаешь и для чего, выйди из профессии, пожалуйста.

anonymous ()

Я КОПИПАСТИЛ ИЗ ГУГЛЯ А ОНО ВСЕ РАВНО!!!11111

чтобы собрать зеркало, нужно было всего лишь кликнуть мышкой на нужном диске

А я в 1987м в tr-dos собирал raid1 силой мысли через нейроинтерфейс, и этот рейд после вылета обоих дисков мне еще полчаса кино показывал.

thesis ★★★★★ ()
Ответ на: комментарий от chukcha

Добавлю: вы не в курсе, почему по сути погибла Mandriva?
Я с их разработчиками очень долго переписывался, указывая на их стратегические ошибки, призывал, спорил, доказывал, что их политика неизбежно приведет к краху.
А они все посмеивалисьна до мной.... и вот вам результат.
Так что не всегда я не прав. Скорее наоборот, только фанатики это никогда не признают.

chukcha ★★★★ ()
Последнее исправление: chukcha (всего исправлений: 1)
Ответ на: комментарий от chukcha

просьба ответить на ЕДИНСТВЕННЫЙ мой вопрос.

Это на вопрос «что делали 20 лет?» — ответ ничего особенного не делали, т.к. все работает прекрасно

Заодно подумайте, почему Linux попрежнему занимает 1%.

Ага щаз! сервера, embedded, android зарулили всех уже. Десктопы тормозят в захвате рынка из-за тупорылых ламеов как ты.

Вопросы отвечены, тему можно закрывать. Или еще поноешь?

futurama ★★★★★ ()
Ответ на: комментарий от Deleted

Слепой осел, тебе уже на всё ответили: Что делали целых 20 лет линуксятники с RAID1? (комментарий)

Это вообще кому этот ответ? Я об этом не спрашивал.

Даже на оригинальный идиотский вопрос ответили: Что делали целых 20 лет линуксятники с RAID1? (комментарий)
но не сделали кнопку - «сделать за.бись».

Не надо делать кнопку «сделать за.бись».
Нужно сделать АВТОМАТИЧЕСКУЮ сборку и поддержание целостности зеркала. Как это давно сделано в ненавистных вам Виндах. Но без мышки - в консоли.

Или у линуксятников за 20 лет до сих пор на набралось нужных ягод в ягодицах?

chukcha ★★★★ ()
Ответ на: комментарий от chukcha

Ты типа пытаешься раскрутить нас на халявную лекцию по использования mdadm?

Иди читай про spare диск и как это использовать для «АВТОМАТИЧЕСКУЮ сборку и поддержание целостности зеркала.»

futurama ★★★★★ ()
Ответ на: комментарий от chukcha

И я не слепой осел, а подслеповатый, но мне не мешает видеть, что здесь есть ослы еще ослее меня.

chukcha ★★★★ ()

Бывает такая ситуация что обе половинки райда будут неконсистентны. Не знаю как этого добился именно ты, самый распространённый сценарий такой:

Винты нынче слишком умные, а sata контроллеры на мамах слишком разные, в результате может возникнуть ситуация при которой запись данных на обе половины райда из абсолютно здоровых винтов будет проходить несинхронно. В этом случае ведро будет выполнять фоновую балансировку зеркал. Если в этот момент пропадает питание обе половины райда получат статус неконсистентных, ядро не будет пытается гадать на какой половине исправные данные, и совершенно правильно, так как объективно повреждены данные на обоих половинах, в разной степени. Тут при ремонте приходится включать интуицию и веру.

Подобная ситуация невозможна при наличии «честного» райда с памятью и батарейкой, так как данные синхронизации «зависнут» в запитанном от батарейки кэше. После возврата питания синхронизация завершится и половинки снова станут консистентны.

Отсюда вывод - пользователи софтварных зеркал должны понимать, что это не «серебрянная пуля» и не замена полноценному райду. Потеря обеих половин одновременно возможна и 100% гарантии целостности нет.

Jameson ★★★★★ ()
Последнее исправление: Jameson (всего исправлений: 3)
Ответ на: комментарий от Jameson

Тогда это

. Хотя, лично я, считаю mdadm уже слегка устаревшим инструментом, я, в то же время, считаю его самым безглючным и надежным среди всех возможных вариантов soft-raid.

как-то не стыкуется с вашим

в результате может возникнуть ситуация при которой запись данных на обе половины райда из абсолютно здоровых винтов будет проходить несинхронно.

chukcha ★★★★ ()

Ну так и вали на винфак. Нам-то зачем мозг париш? Или похвастаться пришел?

anc ★★★★★ ()
Ответ на: комментарий от chukcha

почему по сути погибла Mandriva?

Из-за ламеров виндовозных, у которых палец к мышке уже прирос.

devl547 ★★★★★ ()
Ответ на: комментарий от chukcha

А мдадм в принципе не может разруливать такие вещи. Это проблема не мдадм, а адаптивных технологий записи в винтах, наличии у них очереди команд, особенностей реализации работы sata каналов у контроллеров и т.п. Скажем поступила команда на запись, один винт начал писать, а у второго случилась термокалибровка - рассинхрон.

Аппаратные райды такие вещи учитывают и сглаживают наличием автономной памяти, отключением очереди команд, переводом кэшей винтов в writethrough и т.п.

В случае софтварного райда ты должен озаботиться всем этим сам, mdadm тебе ОЗУ автономно не запитает и винты за тебя не настроит. Слепить конфету из говна можно, но вкус будет так себе...

Jameson ★★★★★ ()
Последнее исправление: Jameson (всего исправлений: 1)
Ответ на: комментарий от anc

Ну так и вали на винфак.


Вот! Это оно самое! Типичный клиничный случай фанатика-линусятника - вместо того, чтобы помочь, или хотя бы признать справделивую критику, вместо этого тех, кто еще балансирует между Линуксом и Виндой - гонят на Винду!
Прям-таки офигенная помощь Линуксу! Потому-то мы и занимаем невъё$енные 1%, офигенно «обгоняя» Винду.

Да таких как ты, гонителей, нужно в первую очередь гнать из Линукс, чтобы только пятки дымылись!
Как наносящего непоправимый вред Linux!

chukcha ★★★★ ()
Ответ на: комментарий от Jameson

А мдадм в принципе не может разруливать такие вещи. Это проблема не мдадм, а адаптивных технологий записи в винтах, наличии у них очереди команд, особенностей реализации работы sata каналов у контроллеров и т.п. Скажем поступила команда на запись, один винт начал писать, а у второго случилась термокалибровка - рассинхрон.

Тогда, справедливости ради, следует признать, что mdadm не просто устарел, выйдя из моды, а еще и не способен разрулировать проблемы, возникающие с новым железом и т.п.

С вышеописанной автоматизацией RAID, как следует из обсуждения, вроде понятно - НЕТ ЕЁ. Иначе бы орали в полный голос.

Таким образом. плавно подходим к другому вопросу: кроме mdadm, что еще есть в Линуксе Soft RAID?

chukcha ★★★★ ()
Ответ на: комментарий от chukcha

Ты просто не понимаешь, что такое программный рейд, да? Или совсем дурачок?

anonymous ()
Ответ на: комментарий от chukcha

Тогда, справедливости ради, следует признать, что mdadm не просто устарел, выйдя из моды, а еще и не способен разрулировать проблемы, возникающие с новым железом и т.п.

Справедливости ради следует признать что ты не понимаешь что тебе говорят. ЛЮБОЙ софтварный райд имеет ряд неразрешимых проблем, могущих выйти боком внезапно, потому что райд - СОФТВАРНЫЙ. Если для твоих задач недопустим даже мизерный шанс попасть в ситуацию с неконсистентностью обеих зеркал нужен райд аппаратный, с батарейкой и памятью.

С вышеописанной автоматизацией RAID, как следует из обсуждения, вроде понятно - НЕТ ЕЁ. Иначе бы орали в полный голос.

Она есть, ей надо уметь пользоваться. Заодно поинтересуйся разницей между винтами для райда (wd линейки red например) и обычными винтами. Вкратце объясню тут. Обычные винты слишком «умные». Начав сбоить они долго и упорно пытаются автоматически восстановиться ставя раком логику райда. (райд не знает почему у него один из винтов никак не может раздуплиться целую минуту и ждёт, в это время раком встаёт вся система) Винты для райдов «думать» не пытаются. Их задача при ошибке отвалиться как можно скорее, дав возможность райду стать деградед и уведомить наконец админа или подключить винт горячей замены и начать восстановление.

Таким образом. плавно подходим к другому вопросу: кроме mdadm, что еще есть в Линуксе Soft RAID?

Есть, множество, только тебя это не спасёт. Матчастью ты не владеешь и овладевать не собираешься. Обратись к системному администатору.

PS. Могло сложиться ощущение от моих слов что софтварный райд - говно полное по определению. Это не так. Во первых нужен бесперебойник, чтобы снизить шансы убить райд по вышеописанному сценарию с синхронизацией при пропадении света например. Во вторых винты нужны raid edition, а не абы какие. В третьих весь мониторинг, автоматику и уведомления нужно продумывать и настраивать самому, все нужные ручки и крутилки для этого есть.

Jameson ★★★★★ ()
Последнее исправление: Jameson (всего исправлений: 3)
Ответ на: комментарий от chukcha

Заодно подумайте, почему Linux попрежнему занимает 1%.

99% устройств затекли жиром. Не пишите так больше.

anc ★★★★★ ()
Ответ на: комментарий от chukcha

Какая автоматизация тебе нужна? Смарт по расписанию дергай смартмоном, /proc/mdstat тоже легко регулярно опрашивать на предмет факапов.

Если нужна автоматизация с мониторингом - есть куча инструментов для этого, начиная от корявенького вебмина и прочих зенталов и заканчивая нагисами и прочими зяббиксами.

Админам локолхоста можно заюзать монит или ещё что полегче. Ну или самосборных пару скриптов на баше, коих дофига напридумано.

darkduke ()
Ответ на: комментарий от Jameson

Винты что ни на есть серверные серии RE - WD1003FBYX
Т.е. избыточным инетллектом блистать не должны.

Она есть, ей надо уметь пользоваться.

Если она на уровне автоматизации mdadm - то это не автоматизация.
Настоящая автоматизация должна упрощать процесс управления без многочасовых копаний в мануалах, т.е. должна быть интуитивно понятной.
Наглядный пример, который всех тут задевает за живое, потому что крыть нечем - это начиная с NT4, и т.д.

chukcha ★★★★ ()
Ответ на: комментарий от chukcha

Не потому ли, что вы не умеете отвечать на вопросы, помогать и принимать справедливую критику?

Все отписавшиеся в треде (кроме ТСа, естественно), это вы виноваты, что у линукса 1%, суке!!!!!11

templarrr ★★★★★ ()
Ответ на: комментарий от darkduke

Если нужна автоматизация с мониторингом - есть куча инструментов для этого, начиная от корявенького вебмина и прочих зенталов и заканчивая нагисами и прочими зяббиксами.
Админам локолхоста можно заюзать монит или ещё что полегче. Ну или самосборных пару скриптов на баше, коих дофига напридумано.


А это уже интереснее!
Я еще хотел было написать, что если эти бездельники за 20 лет не сделали удобный интерефейс управления рейдом, то хотя бы скриптики как временное решение наваяли.
Оказывается, есть такое, можно нем поподробнее?

Одно время пользовался вебмином (не для рейдов), а потому понял, что он имеет только красивую веб-морду и только, а знаний, чтобы управлять системой с его помощт, нужно не меньше, чем при управлении с консоли. В-общем, красивая обертка и не более того.

chukcha ★★★★ ()
Ответ на: комментарий от chukcha

что если эти бездельники за 20 лет не сделали удобный интерефейс управления рейдом

0_О

int13h ★★★★★ ()
Ответ на: комментарий от chukcha

Настоящая автоматизация должна упрощать процесс управления без многочасовых копаний в мануалах, т.е. должна быть интуитивно понятной.

Наглядный пример, который всех тут задевает за живое, потому что крыть нечем - это начиная с NT4, и т.д.

Для этого есть коммерческие аппаратные решения. NT4 кстати тоже вполне коммерческая. Но хочу тебя огорчить, читать документацию всё равно придётся :( Единственный интуитивно-понятный интерфейс - женская грудь. Остальному нужно учиться.

Софтварный райд в линуксе - конструктор «сделай сам», mdadm лишь один из кубиков. Согласно философии юникс одна программа должна делать только одну вещь, другие вещи делают другие программы, подразумевается что комбинируешь вместе их ты. mdadm отвечает собственно за логику работы райда, мониторинг, автоматика и уведомление возлагаются на программы мониторинга, самописные скрипты и общесистемные средства уведомления о событиях.

Если тебя это не устраивает используй коммерческие решения.

Jameson ★★★★★ ()
Последнее исправление: Jameson (всего исправлений: 1)
Ответ на: комментарий от Jameson

Ок, тогда по этим докам непонятно - какую же реальную отказоустойчивость обеспечивает Soft RAID?

Судя по этим мелким шрифтом длинны мануалам - никакую.
Потому что если что отказало в рейде - беги ножками к серверу и восстанавливай его ручками.

Это совершенно не вписывается в мое понятие отказоустойивости, а также то, которое реализовано в винде.

chukcha ★★★★ ()

Читаем твоё сообщение:

Сначала расцепил RAID,

и далее

один исправный диск должен запуститься один, самостоятельно, вне зеркала!

Вот и твоя ошибка. В общем случае нет, не должен. Надо было выкинуть битый диск из зеркала, не «расцепляя» рейда, по алгоритму, который тебе выше дал BaBL. А ты решил выпендриться и получил себе проблему, т.ч. ССЗБ, наслаждайся теперь результатами ;)

NightOperator ★★★ ()
Ответ на: комментарий от chukcha

Как отдельные демоны легко описывается в родных манах:

https://raid.wiki.kernel.org/index.php/Detecting,_querying_and_testing#Monito...

https://www.smartmontools.org/wiki/TocDoc#Tutorials

Bonus - http://linuxshare.ru/docs/admin/ud_sraid.html

Можно проще. С монитом, напр: https://habrahabr.ru/post/73506/ - вводная

https://mmonit.com/wiki/Monit/ConfigurationExamples#softwareraid - подсказка по софтрэйду

https://mmonit.com/wiki/Monit/ConfigurationExamples#HDDTemp - подсказка по параметрам смарта

darkduke ()
Ответ на: комментарий от chukcha

Ок, тогда по этим докам непонятно - какую же реальную отказоустойчивость обеспечивает Soft RAID?

При грамотном подходе (бесперебойник, правильные винты, грамотная настройка) высокую, но не 100%, так как остаются шансы аппаратно зависнуть из за бага ядра или видеокарты например в момент когда происходит запись с балансировкой и потерять таки райд. Для дома это обычно приемлимые риски, у большинства подобное происходит крайне редко. И (это прописная истина, её имеет смысл вырезать отвёрткой на лбу) никакой райд не заменяет и не отменяет резервного копирования.

Для более ответственных задач и продакшена райд нужен аппаратный. И он 100% не даст, так как сама по себе железка тоже может сгореть, два винта из одной партии могут отказать одновременно и т.п.

Потому что если что отказало в рейде - беги ножками к серверу и восстанавливай его ручками.

Для этого есть «винты горячей замены» и скрипты. Райд в большинстве случаев восстановится нормально и автоматически на диск горячей замены, если ты это настроишь. Описанный мною выше сценарий с запоротыми обеими половинами всего лишь вероятен, а не обязателен. И в этом случае тоже в большинстве случаев удаётся восстановиться, только уже руками, автоматика тут не поможет так как нет однозначности, и нужен ум человека, исследовать и решить какая половина менее повреждена, починить её и т.п. В случае нормальной «штатной» деградации райда всё рутинно восстановится, если настроить конечно.

Это совершенно не вписывается в мое понятие отказоустойивости, а также то, которое реализовано в винде.

А с виндой тебе просто тупо везло. Я вот несколько раз сталкивался. Сценарий расколбаса зеркала в винде такой же, шансы потерять обе половинки те же, так как это не проблемы конкретной программной реализации в той или иной ОС, а недостатки самой технологии. Зато «райд бесплатно».

Jameson ★★★★★ ()
Последнее исправление: Jameson (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.