LINUX.ORG.RU

Raid level 1 devices 2 - как его обслуживать?

 ,


0

1

Создал RAID из двух трёхгигабайтных винта TOSHIBA DT01ACA300 в состоянии SMART Pre-fail и Old_age. Один помрёт, другой вытянет. Срочно нужно хранилище, пока подбираю какие купить новые винты в массив. Буду признателен советам, что выбрать.

Итак создал массив. Сейчас активно им пользуюсь, временами начинает подтормаживать (на него активно пишут и читают два сетевых приложения):

mdadm --create /dev/md0 --level=1 --raid-devices=2 /dev/sdc1 /dev/sdd1


1) В свете этого вопрос - как я узнаю, если один винт накроется, может системное сообщение придёт? Я же не могу постоянно грузиться с флешкой с victoria и проверять поверхность, или даже smart регулярно читать надоест или забуду.
2) Если накрылся, ставлю новый, он сам начнёт на него копию накатывать, или какую-то надо команду дать?

Попробуй сделать от рута:

echo 1 > /sys/block/sdc/sdc1/make-it-fail

и посмотри, что произойдёт.

Возможно, перед этим придётся пересобрать ядро с включением CONFIG_FAIL_MAKE_REQUEST.

i-rinat ★★★★★ ()
Последнее исправление: i-rinat (всего исправлений: 1)
  1. cat /proc/mdstat;
  2. Если накрылся, то старый вытаскиваешь физически, ставишь новый, размечаешь его так, чтобы он в массив влез и потом добавляешь madm --add - как-то так.
turtle_bazon ★★★★★ ()
Ответ на: комментарий от anonymous


1) Одновременно покупать и новые накопители и бекапы я не готов. Мне видится raid1 более лучшим решением, чем один диск на хранение бекапов, а другой на пользование. Получается один пашет на износ, второй лежит на полке и даром ток с разъёмами пожирает.

2) 250Гб, 2.5" за 3.5к ? Если вы не шутите, то обоснуйте. Мне нужен накопитель бОльшего объёма и даже не 1Тб, а минимум 3. не обязательно SSD, не обязательно 2.5". Мне не в ноутбук системный диск нужен, а большое хранилище больших файлов. У меня на ваш вариант чтобы массив 3-5Тб собрать, не хватит ни денег, ни sata разъёмов на матери.

hikikomori ★★★ ()
Ответ на: комментарий от i-rinat

Люблю я такие советы) А что потом с этим делать?

Имитировать отказ одного из RAID-дисков можно и с помощью специальных ключей команды mdadm, как показано ниже:

mdadm /dev/md0 --set-faulty /dev/sdc1
или
mdadm /dev/md0 --fail /dev/sdc1


И что я увижу? У меня «ТРЕВОГА!» в консоли загорится?)
Но а как обратно его после этого запустить?

hikikomori ★★★ ()
Ответ на: комментарий от turtle_bazon

1) Я это видел, поясните плз, что там что и что такое [UU]?

Personalities : [raid1] 
md0 : active raid1 sdd1[1] sdc1[0]
      2930129920 blocks super 1.2 [2/2] [UU]
      bitmap: 4/22 pages [16KB], 65536KB chunk


2) Допустим addнул, а далее он сам на него копию данных закатывает, вешая систему, или какой командой?

hikikomori ★★★ ()
Ответ на: комментарий от hikikomori

что такое [UU]?

[UU] — Up, Up. Если диск выйдет из строя, то вместо U будет _

далее он сам на него копию данных закатывает

Да, прогресс см. watch cat /proc/mdstat

Evenik ()
Последнее исправление: Evenik (всего исправлений: 2)
Ответ на: комментарий от Evenik

Фолтнул, удалил, добавил тут же обратно. Как долго он будет входить в рабочее состояние? тупо делать копию всех 3Тб несколько часов?

sudo mdadm --manage /dev/md0 --fail /dev/sdd1
sudo mdadm --manage /dev/md0 --remove /dev/sdd1
sudo mdadm --manage /dev/md0 --add /dev/sdd1


 cat /proc/mdstat 
Personalities : [raid1] 
md0 : active raid1 sdd1[1] sdc1[0]
      2930129920 blocks super 1.2 [2/1] [U_]
      [=>...................]  recovery =  6.4% (188701248/2930129920) finish=365.9min speed=124837K/sec
      bitmap: 4/22 pages [16KB], 65536KB chunk

unused devices: <none>



Ай нет, вроде уже поднялся, пока писал.

cat /proc/mdstat 
Personalities : [raid1] 
md0 : active raid1 sdd1[1] sdc1[0]
      2930129920 blocks super 1.2 [2/2] [UU]
      bitmap: 4/22 pages [16KB], 65536KB chunk

unused devices: <none>

hikikomori ★★★ ()
Ответ на: комментарий от hikikomori

Как долго он будет входить в рабочее состояние?

Если данные целы, то очень быстро. Если диск пустой, то несколько часов.

Evenik ()
Последнее исправление: Evenik (всего исправлений: 3)
Ответ на: комментарий от Evenik

НЕ очень сходу понял, как это работает, но попробую. Хотя лучше бы не имейл, а уведомление на мобилу через kde connect, либо в системные уведомления.

hikikomori ★★★ ()
Ответ на: комментарий от hikikomori

Мне видится raid1 более лучшим решением, чем один диск на хранение бекапов, а другой на пользование

На всякий случай, RAID не отменяет необходимость резервного копирования. Отказ накопителя — не единственная причина потери данных.

Evenik ()
Ответ на: комментарий от Evenik

Я понимаю. а что может случиться с raid1, и как его чинить?
И куда мне сложить 5Тб данных бэкапов? Накупить ещё винтов? Слышал от хранения на полке они тоже могут гикнуться просто так.

hikikomori ★★★ ()

в состоянии SMART Pre-fail и Old_age

Кто-то, что-то, не так понял. Не бывает таких состояний. Это тип параметра, а не его качественная характеристика.

vvn_black ★★★★★ ()
Ответ на: комментарий от hikikomori

Я понимаю. а что может случиться с raid1, и как его чинить?

С массивом — ничего, но можно, например, случайно удалить и т.п.

И куда мне сложить 5Тб данных бэкапов? Накупить ещё винтов?

Зависит от ценности информации. Диски, ленты, облака...

Слышал от хранения на полке они тоже могут гикнуться просто так.

Маловероятно, но даже если, то останется рабочая копия. А подобие rm -rf / мгновенно разрушит данные на всех дисках зеркала.

Evenik ()
Ответ на: комментарий от Evenik

Может дешевле стриммер прикупить? В облака не верю. Либо места мало, либо денег плати. Были бы на это деньги, уже настроил бы бекапы на выделенный сервер.

Про rm -rf / я узнал ещё задолго до знакомства с линуксом) Даже рассмотрел особо замыслованные вариации на perl. Вообще, стараюсь сначал думать, что ввожу, и потом уже пробовать по ssh на подопытном локальном серваке.

hikikomori ★★★ ()
Ответ на: комментарий от hikikomori

Имитировать отказ одного из RAID-дисков можно и с помощью специальных ключей команды mdadm

Ну отлично, тогда фейлить на уровне блочных устройств не нужно.

И что я увижу? У меня «ТРЕВОГА!» в консоли загорится?)

Сделай и посмотри. Что за странные вопросы?

Но а как обратно его после этого запустить?

Ну там как-нибудь на ходу разберёшься.

Люблю я такие советы)

А какой ответ ты ожидал? Это не риторический вопрос. Мне теперь интересно стало, что ты ожидал прочитать. Потому что я бы в подобной ситуации спрашивал как сэмулировать сбой, чтобы сделать это на целевой системе и посмотреть на её реакцию.

i-rinat ★★★★★ ()
Ответ на: комментарий от hikikomori

Понял, внёс в копилку

Тест и вывод только в случае ошибок:

$ sudo smartctl -H -q errorsonly /dev/sda

А что это говорит? Общее допустимое состояние ок?

Что тест пройден. В плохом случае будет:

SMART overall-health self-assessment test result: FAILED! Drive failure expected in less than 24 hours. SAVE ALL ...

Evenik ()
Последнее исправление: Evenik (всего исправлений: 1)
Ответ на: комментарий от i-rinat

А какой ответ ты ожидал? Это не риторический вопрос.

Выше с комрадом Evenik этот вопрос уже разобрал, спасибо.

hikikomori ★★★ ()
Ответ на: комментарий от Evenik

SMART overall-health self-assessment test result: FAILED! Drive failure expected in less than 24 hours. SAVE ALL ...

Ну что мой старый так не сказанул перед смертью? Или сказанул. Но я же не смотрю постоянно смарт. Пойду почитаю как это настроить.

hikikomori ★★★ ()
Ответ на: комментарий от hikikomori

Ну что мой старый так не сказанул перед смертью?

Потому что диски делятся на два типа: первые показывают в смарте плохие параметры, а у вторых по смарту всё хорошо. А отказывают все (и первые и вторые) одинаково - неожиданно.

vvn_black ★★★★★ ()
Последнее исправление: vvn_black (всего исправлений: 1)
Ответ на: комментарий от hikikomori

Ну что мой старый так не сказанул перед смертью?

У меня недавно на сервере диск отказал с ошибкой открытия даже с помошью smartmontools. В системе файл устройства остался, поэтому оповещение smartdmdadm, конечно) пришло. После перезагрузки диск ожил, массив синхронизировался, SMART-тест проходит. Через месяц ситуация повторилась — диск заменил.

Evenik ()
Последнее исправление: Evenik (всего исправлений: 2)
Ответ на: комментарий от hikikomori

Мне видится raid1 более лучшим решением

Это зависит от задачи. Если нужно сократить даунтайм, то да. Если нужно не просрать данные — нет. Где будет RAID, когда сгорит со всеми дисками блок питания? Где он будет после случайного rm -rf? RAID1 — это в твоём случае маленькая роскошь, которую можно позволить в дополнение к резервной копии, не наоборот.

Получается один пашет на износ, второй лежит на полке и даром ток с разъёмами пожирает.

Стоит попробовать отбросить это «субъективно-интуитивное» восприятие и рассудить более объективно

  1. OK.
anonymous ()
Ответ на: комментарий от anonymous

2) ОК то ok, но Вы даже не обосновали своё предложение, SSD всё ещё слишком дороги для хранения больших массивов данных.

Стоит попробовать отбросить это «субъективно-интуитивное» восприятие и рассудить более объективно

Допустим я купил отдельно 5Тб винт, подключаю его на горячую через usb3.0 адаптер, и делаю на него бекапы с raid через rsync. Или NAS купить? Но дополнительная нагрузка на LAN будет. Есть ли этому альтернатива без регистрации и смс? Стримеры вроде бы отошли в прошлое?

hikikomori ★★★ ()
Ответ на: комментарий от hikikomori

ОК то ok, но Вы даже не обосновали своё предложение

Я допускал, что тебе не обязательно нужны 3 Тб, а если хватит одного, то SSD вполне вариант. Да и на 2 Тб сейчас можно купить накопитель по человеческой цене.

Допустим я купил отдельно 5Тб винт, подключаю его на горячую через usb3.0 адаптер, и делаю на него бекапы с raid через rsync

Нормально вполне.

Или NAS купить?

Тоже неплохо, но в магазинном NAS запросто половина цены может приходиться на операционную систему. Если не хочется заморачиваться, но необходимо автоматизировать резервное копирование, то можно и купить, конечно.

anonymous ()
Ответ на: комментарий от hikikomori
  1. UU - значит, что всё хорошо. _U или U_ - значит, что-то вылетело и не видно. Может быть ещё F - это fail если установлен. Обычно вручную.
  2. Ну адднул и ждёшь, пока он данные закатает. Если система нагруженная, то может по IO сильно просесть. Тогда можно уменьшить скорость закатывания, но окончание процесса отодвинется.
turtle_bazon ★★★★★ ()
Последнее исправление: turtle_bazon (всего исправлений: 2)
Ответ на: комментарий от Evenik

Немного возвращаясь к уведмолению о состоянии smart:

Можно настроить smartd и mdadm на отправку уведомлений. Например: https://wiki.archlinux.org/index.php/S.M.A.R.T.#Notifying_potential_problems


Там, чтобы это настроить, нужно подквест выполнить по настройке почтового сервера: «To be able to send the email externally (i.e. not to the root mail account) a MTA (Mail Transport Agent) or a MUA (Mail User Agent) will need to be installed and configured. »

Как и что проще поставить?
Если я правильно понял, мне нужно нагуглить нормальную статью на русском по настройке S-nail, и сперва с ней разобраться, потом вернуться к этому.

upd: ничего по-русски не нашёл, только англ https://wiki.archlinux.org/index.php/S-nail

hikikomori ★★★ ()
Последнее исправление: hikikomori (всего исправлений: 3)
Ответ на: комментарий от hikikomori

Там, чтобы это настроить, нужно подквест выполнить по настройке почтового сервера

До сих пор плохо знаком с электропочтой, пусть лучше другие подскажут.

У меня (Debian) в качестве MTA установлен и в первом приближении настроен Exim4. В т.ч. в файле /etc/email-addresses содержаться пары пользователь-адрес для отправки.

Проверяю так: echo 'Test message' | mail -s 'Test' внешний@адрес

Evenik ()
Последнее исправление: Evenik (всего исправлений: 1)
Ответ на: комментарий от hikikomori

от хранения на полке они тоже могут гикнуться просто так.

Винты - сильно вряд ли. SSD данные скорее всего потеряет, если долго держать без питания(в интернете писали что от полугода и выше многие модели данные уже теряют)

Pinkbyte ★★★★★ ()
23 февраля 2020 г.
Ответ на: комментарий от Evenik

Сейчас буду менять в массиве диски на большего объёма, с 3 на 4Тб. Не знаю как быть, можно ли добавить в массив два новых диска, а после синхронизации удалить два старых, или такой фокус не пройдёт, и массив будет равен объёму старых дисков, даже когда они из него уйдут? Или объём массива сам увеличится до объёма новых накопителей, когда останутся только они?

В противном случае придется подымать ещё один рейд рядом и просто копировать с rsync.

hikikomori ★★★ ()
Ответ на: комментарий от Evenik

Про --grow слышал, гуглю. Если не разберусь создам, хотя опять возгорания седалищ анонов будет как в теме про perlrename.

hikikomori ★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.