Raid level 1 devices 2 - как его обслуживать?

0

1

Создал RAID из двух трёхгигабайтных винта TOSHIBA DT01ACA300 в состоянии SMART Pre-fail и Old_age. Один помрёт, другой вытянет. Срочно нужно хранилище, пока подбираю какие купить новые винты в массив. Буду признателен советам, что выбрать.

Итак создал массив. Сейчас активно им пользуюсь, временами начинает подтормаживать (на него активно пишут и читают два сетевых приложения):

mdadm --create /dev/md0 --level=1 --raid-devices=2 /dev/sdc1 /dev/sdd1

1) В свете этого вопрос - как я узнаю, если один винт накроется, может системное сообщение придёт? Я же не могу постоянно грузиться с флешкой с victoria и проверять поверхность, или даже smart регулярно читать надоест или забуду.
2) Если накрылся, ставлю новый, он сам начнёт на него копию накатывать, или какую-то надо команду дать?

Ссылка

← Можно ли в X11 настроить разный sub-pixel rendering type для разных мониторов?

Arch, Plasma. Сломался скейлинг →

Восстановить данные с hdd

Raid level 1

Ничему тебя жизнь не учит. Бэкапы нужны, а не RAID.

подбираю какие купить новые винты

Samsung 860 EVO.

anonymous
(17.01.20 21:44:03 MSK)

Попробуй сделать от рута:

echo 1 > /sys/block/sdc/sdc1/make-it-fail

и посмотри, что произойдёт.

Возможно, перед этим придётся пересобрать ядро с включением CONFIG_FAIL_MAKE_REQUEST.

i-rinat ★★★★★
(17.01.20 21:46:16 MSK)
Последнее исправление: i-rinat 17.01.20 21:47:33 MSK (всего исправлений: 1)

cat /proc/mdstat;
Если накрылся, то старый вытаскиваешь физически, ставишь новый, размечаешь его так, чтобы он в массив влез и потом добавляешь madm --add - как-то так.

turtle_bazon ★★★★★
(17.01.20 22:26:31 MSK)

Ответ на: комментарий от anonymous 17.01.20 21:44:03 MSK

1) Одновременно покупать и новые накопители и бекапы я не готов. Мне видится raid1 более лучшим решением, чем один диск на хранение бекапов, а другой на пользование. Получается один пашет на износ, второй лежит на полке и даром ток с разъёмами пожирает.

2) 250Гб, 2.5" за 3.5к ? Если вы не шутите, то обоснуйте. Мне нужен накопитель бОльшего объёма и даже не 1Тб, а минимум 3. не обязательно SSD, не обязательно 2.5". Мне не в ноутбук системный диск нужен, а большое хранилище больших файлов. У меня на ваш вариант чтобы массив 3-5Тб собрать, не хватит ни денег, ни sata разъёмов на матери.

hikikomori ★★★☆
(17.01.20 23:02:57 MSK) автор топика

Ответ на: комментарий от i-rinat 17.01.20 21:46:16 MSK

Люблю я такие советы) А что потом с этим делать?

Имитировать отказ одного из RAID-дисков можно и с помощью специальных ключей команды mdadm, как показано ниже:

mdadm /dev/md0 --set-faulty /dev/sdc1
или
mdadm /dev/md0 --fail /dev/sdc1

И что я увижу? У меня «ТРЕВОГА!» в консоли загорится?)
Но а как обратно его после этого запустить?

hikikomori ★★★☆
(17.01.20 23:06:51 MSK) автор топика

Ответ на: комментарий от turtle_bazon 17.01.20 22:26:31 MSK

1) Я это видел, поясните плз, что там что и что такое [UU]?

Personalities : [raid1] 
md0 : active raid1 sdd1[1] sdc1[0]
      2930129920 blocks super 1.2 [2/2] [UU]
      bitmap: 4/22 pages [16KB], 65536KB chunk

2) Допустим addнул, а далее он сам на него копию данных закатывает, вешая систему, или какой командой?

hikikomori ★★★☆
(17.01.20 23:09:59 MSK) автор топика

В Debian по умолчанию будут письма от smartd и mdadm пока не починешь
https://www.thegeekdiary.com/replacing-a-failed-mirror-disk-in-a-software-rai...

~~Evenik~~ ★★
(17.01.20 23:15:52 MSK)

Ответ на: комментарий от Evenik 17.01.20 23:15:52 MSK

Спасибо за ссылку, информативно.
У меня Manjaro KDE.
https://wiki.archlinux.org/index.php/RAID

hikikomori ★★★☆
(17.01.20 23:19:35 MSK) автор топика
Последнее исправление: hikikomori 17.01.20 23:21:17 MSK (всего исправлений: 1)

Ответ на: комментарий от hikikomori 17.01.20 23:09:59 MSK

что такое [UU]?

[UU] — Up, Up. Если диск выйдет из строя, то вместо U будет _

далее он сам на него копию данных закатывает

Да, прогресс см. watch cat /proc/mdstat

~~Evenik~~ ★★
(17.01.20 23:19:36 MSK)
Последнее исправление: Evenik 17.01.20 23:24:59 MSK (всего исправлений: 2)

Ответ на: комментарий от hikikomori 17.01.20 23:19:35 MSK

У меня Manjaro KDE.

Можно настроить smartd и mdadm на отправку уведомлений.

Например: https://wiki.archlinux.org/index.php/S.M.A.R.T.#Notifying_potential_problems

~~Evenik~~ ★★
(17.01.20 23:29:35 MSK)
Последнее исправление: Evenik 17.01.20 23:30:17 MSK (всего исправлений: 1)

Ответ на: комментарий от Evenik 17.01.20 23:19:36 MSK

Фолтнул, удалил, добавил тут же обратно. Как долго он будет входить в рабочее состояние? тупо делать копию всех 3Тб несколько часов?

sudo mdadm --manage /dev/md0 --fail /dev/sdd1
sudo mdadm --manage /dev/md0 --remove /dev/sdd1
sudo mdadm --manage /dev/md0 --add /dev/sdd1

 cat /proc/mdstat 
Personalities : [raid1] 
md0 : active raid1 sdd1[1] sdc1[0]
      2930129920 blocks super 1.2 [2/1] [U_]
      [=>...................]  recovery =  6.4% (188701248/2930129920) finish=365.9min speed=124837K/sec
      bitmap: 4/22 pages [16KB], 65536KB chunk

unused devices: <none>

Ай нет, вроде уже поднялся, пока писал.

cat /proc/mdstat 
Personalities : [raid1] 
md0 : active raid1 sdd1[1] sdc1[0]
      2930129920 blocks super 1.2 [2/2] [UU]
      bitmap: 4/22 pages [16KB], 65536KB chunk

unused devices: <none>

hikikomori ★★★☆
(17.01.20 23:43:31 MSK) автор топика

Ответ на: комментарий от hikikomori 17.01.20 23:43:31 MSK

Как долго он будет входить в рабочее состояние?

Если данные целы, то очень быстро. Если диск пустой, то несколько часов.

~~Evenik~~ ★★
(17.01.20 23:47:15 MSK)
Последнее исправление: Evenik 17.01.20 23:55:15 MSK (всего исправлений: 3)

Ссылка

Ответ на: комментарий от Evenik 17.01.20 23:29:35 MSK

НЕ очень сходу понял, как это работает, но попробую. Хотя лучше бы не имейл, а уведомление на мобилу через kde connect, либо в системные уведомления.

hikikomori ★★★☆
(17.01.20 23:51:54 MSK) автор топика

Ссылка

Ответ на: комментарий от hikikomori 17.01.20 23:02:57 MSK

Мне видится raid1 более лучшим решением, чем один диск на хранение бекапов, а другой на пользование

На всякий случай, RAID не отменяет необходимость резервного копирования. Отказ накопителя — не единственная причина потери данных.

~~Evenik~~ ★★
(17.01.20 23:53:12 MSK)

Ответ на: комментарий от Evenik 17.01.20 23:53:12 MSK

Я понимаю. а что может случиться с raid1, и как его чинить?
И куда мне сложить 5Тб данных бэкапов? Накупить ещё винтов? Слышал от хранения на полке они тоже могут гикнуться просто так.

hikikomori ★★★☆
(17.01.20 23:57:09 MSK) автор топика

в состоянии SMART Pre-fail и Old_age

Кто-то, что-то, не так понял. Не бывает таких состояний. Это тип параметра, а не его качественная характеристика.

vvn_black ★★★★★
(17.01.20 23:58:03 MSK)

Ответ на: комментарий от hikikomori 17.01.20 23:57:09 MSK

Я понимаю. а что может случиться с raid1, и как его чинить?

С массивом — ничего, но можно, например, случайно удалить и т.п.

И куда мне сложить 5Тб данных бэкапов? Накупить ещё винтов?

Зависит от ценности информации. Диски, ленты, облака...

Слышал от хранения на полке они тоже могут гикнуться просто так.

Маловероятно, но даже если, то останется рабочая копия. А подобие rm -rf / мгновенно разрушит данные на всех дисках зеркала.

~~Evenik~~ ★★
(18.01.20 00:03:52 MSK)

Ответ на: комментарий от vvn_black 17.01.20 23:58:03 MSK

Спасибо, что поправили. Что скажите свежим глазом?
https://pastebin.com/Eian70Zr

hikikomori ★★★☆
(18.01.20 00:08:11 MSK) автор топика

Ответ на: комментарий от hikikomori 18.01.20 00:08:11 MSK

https://pastebin.com/Eian70Zr
SMART overall-health self-assessment test result: PASSED
PASSED

Это главное.

~~Evenik~~ ★★
(18.01.20 00:11:07 MSK)

Ответ на: комментарий от hikikomori 18.01.20 00:08:11 MSK

По смарту всё хорошо. 2 года в эксплуатации.

vvn_black ★★★★★
(18.01.20 00:12:47 MSK)

Ссылка

Ответ на: комментарий от Evenik 18.01.20 00:03:52 MSK

Может дешевле стриммер прикупить? В облака не верю. Либо места мало, либо денег плати. Были бы на это деньги, уже настроил бы бекапы на выделенный сервер.

Про rm -rf / я узнал ещё задолго до знакомства с линуксом) Даже рассмотрел особо замыслованные вариации на perl. Вообще, стараюсь сначал думать, что ввожу, и потом уже пробовать по ssh на подопытном локальном серваке.

hikikomori ★★★☆
(18.01.20 00:13:41 MSK) автор топика

Ссылка

Ответ на: комментарий от Evenik 18.01.20 00:11:07 MSK

Понял, внёс в копилку:
sudo smartctl --all /dev/sdd |grep PASSED

А что это говорит? Общее допустимое состояние ок?

hikikomori ★★★☆
(18.01.20 00:15:58 MSK) автор топика

Ответ на: комментарий от hikikomori 17.01.20 23:06:51 MSK

Имитировать отказ одного из RAID-дисков можно и с помощью специальных ключей команды mdadm

Ну отлично, тогда фейлить на уровне блочных устройств не нужно.

И что я увижу? У меня «ТРЕВОГА!» в консоли загорится?)

Сделай и посмотри. Что за странные вопросы?

Но а как обратно его после этого запустить?

Ну там как-нибудь на ходу разберёшься.

Люблю я такие советы)

А какой ответ ты ожидал? Это не риторический вопрос. Мне теперь интересно стало, что ты ожидал прочитать. Потому что я бы в подобной ситуации спрашивал как сэмулировать сбой, чтобы сделать это на целевой системе и посмотреть на её реакцию.

i-rinat ★★★★★
(18.01.20 00:25:00 MSK)

Ответ на: комментарий от hikikomori 18.01.20 00:15:58 MSK

Понял, внёс в копилку

Тест и вывод только в случае ошибок:

$ sudo smartctl -H -q errorsonly /dev/sda

А что это говорит? Общее допустимое состояние ок?

Что тест пройден. В плохом случае будет:

SMART overall-health self-assessment test result: FAILED! Drive failure expected in less than 24 hours. SAVE ALL ...

~~Evenik~~ ★★
(18.01.20 00:27:04 MSK)
Последнее исправление: Evenik 18.01.20 00:28:50 MSK (всего исправлений: 1)

Ответ на: комментарий от i-rinat 18.01.20 00:25:00 MSK

А какой ответ ты ожидал? Это не риторический вопрос.

Выше с комрадом Evenik этот вопрос уже разобрал, спасибо.

hikikomori ★★★☆
(18.01.20 00:30:54 MSK) автор топика

Ссылка

Ответ на: комментарий от Evenik 18.01.20 00:27:04 MSK

SMART overall-health self-assessment test result: FAILED! Drive failure expected in less than 24 hours. SAVE ALL ...

Ну что мой старый так не сказанул перед смертью? Или сказанул. Но я же не смотрю постоянно смарт. Пойду почитаю как это настроить.

hikikomori ★★★☆
(18.01.20 00:33:52 MSK) автор топика

Ответ на: комментарий от hikikomori 18.01.20 00:33:52 MSK

Ну что мой старый так не сказанул перед смертью?

Потому что диски делятся на два типа: первые показывают в смарте плохие параметры, а у вторых по смарту всё хорошо. А отказывают все (и первые и вторые) одинаково - неожиданно.

vvn_black ★★★★★
(18.01.20 00:37:03 MSK)
Последнее исправление: vvn_black 18.01.20 00:37:26 MSK (всего исправлений: 1)

Ответ на: комментарий от vvn_black 18.01.20 00:37:03 MSK

Философский тезис унесён в цитатник)

hikikomori ★★★☆
(18.01.20 00:56:43 MSK) автор топика

Ссылка

Ответ на: комментарий от hikikomori 18.01.20 00:33:52 MSK

Ну что мой старый так не сказанул перед смертью?

У меня недавно на сервере диск отказал с ошибкой открытия даже с помошью smartmontools. В системе файл устройства остался, поэтому оповещение smartd (и mdadm, конечно) пришло. После перезагрузки диск ожил, массив синхронизировался, SMART-тест проходит. Через месяц ситуация повторилась — диск заменил.

~~Evenik~~ ★★
(18.01.20 00:59:44 MSK)
Последнее исправление: Evenik 18.01.20 01:06:50 MSK (всего исправлений: 2)

Ссылка

Ответ на: комментарий от hikikomori 17.01.20 23:02:57 MSK

Мне видится raid1 более лучшим решением

Это зависит от задачи. Если нужно сократить даунтайм, то да. Если нужно не просрать данные — нет. Где будет RAID, когда сгорит со всеми дисками блок питания? Где он будет после случайного rm -rf? RAID1 — это в твоём случае маленькая роскошь, которую можно позволить в дополнение к резервной копии, не наоборот.

Получается один пашет на износ, второй лежит на полке и даром ток с разъёмами пожирает.

Стоит попробовать отбросить это «субъективно-интуитивное» восприятие и рассудить более объективно

anonymous
(18.01.20 06:57:30 MSK)

Ответ на: комментарий от anonymous 18.01.20 06:57:30 MSK

2) ОК то ok, но Вы даже не обосновали своё предложение, SSD всё ещё слишком дороги для хранения больших массивов данных.

Стоит попробовать отбросить это «субъективно-интуитивное» восприятие и рассудить более объективно

Допустим я купил отдельно 5Тб винт, подключаю его на горячую через usb3.0 адаптер, и делаю на него бекапы с raid через rsync. Или NAS купить? Но дополнительная нагрузка на LAN будет. Есть ли этому альтернатива без регистрации и смс? Стримеры вроде бы отошли в прошлое?

hikikomori ★★★☆
(18.01.20 14:45:19 MSK) автор топика

Ответ на: комментарий от hikikomori 18.01.20 14:45:19 MSK

ОК то ok, но Вы даже не обосновали своё предложение

Я допускал, что тебе не обязательно нужны 3 Тб, а если хватит одного, то SSD вполне вариант. Да и на 2 Тб сейчас можно купить накопитель по человеческой цене.

Допустим я купил отдельно 5Тб винт, подключаю его на горячую через usb3.0 адаптер, и делаю на него бекапы с raid через rsync

Нормально вполне.

Или NAS купить?

Тоже неплохо, но в магазинном NAS запросто половина цены может приходиться на операционную систему. Если не хочется заморачиваться, но необходимо автоматизировать резервное копирование, то можно и купить, конечно.

anonymous
(18.01.20 15:01:54 MSK)

Ссылка

Ответ на: комментарий от hikikomori 17.01.20 23:09:59 MSK

UU - значит, что всё хорошо. _U или U_ - значит, что-то вылетело и не видно. Может быть ещё F - это fail если установлен. Обычно вручную.
Ну адднул и ждёшь, пока он данные закатает. Если система нагруженная, то может по IO сильно просесть. Тогда можно уменьшить скорость закатывания, но окончание процесса отодвинется.

turtle_bazon ★★★★★
(18.01.20 17:11:19 MSK)
Последнее исправление: turtle_bazon 18.01.20 17:12:00 MSK (всего исправлений: 2)

Ссылка

Ответ на: комментарий от Evenik 17.01.20 23:29:35 MSK

Немного возвращаясь к уведмолению о состоянии smart:

Можно настроить smartd и mdadm на отправку уведомлений. Например: https://wiki.archlinux.org/index.php/S.M.A.R.T.#Notifying_potential_problems

Там, чтобы это настроить, нужно подквест выполнить по настройке почтового сервера: «To be able to send the email externally (i.e. not to the root mail account) a MTA (Mail Transport Agent) or a MUA (Mail User Agent) will need to be installed and configured. »

Как и что проще поставить?
Если я правильно понял, мне нужно нагуглить нормальную статью на русском по настройке S-nail, и сперва с ней разобраться, потом вернуться к этому.

upd: ничего по-русски не нашёл, только англ https://wiki.archlinux.org/index.php/S-nail

hikikomori ★★★☆
(18.01.20 18:25:38 MSK) автор топика
Последнее исправление: hikikomori 18.01.20 18:36:45 MSK (всего исправлений: 3)

Ответ на: комментарий от hikikomori 18.01.20 18:25:38 MSK

Там, чтобы это настроить, нужно подквест выполнить по настройке почтового сервера

До сих пор плохо знаком с электропочтой, пусть лучше другие подскажут.

У меня (Debian) в качестве MTA установлен и в первом приближении настроен Exim4. В т.ч. в файле /etc/email-addresses содержаться пары пользователь-адрес для отправки.

Проверяю так: echo 'Test message' | mail -s 'Test' внешний@адрес

~~Evenik~~ ★★
(18.01.20 21:00:28 MSK)
Последнее исправление: Evenik 18.01.20 21:16:51 MSK (всего исправлений: 1)

Ссылка

http://xgu.ru/wiki/mdadm

Tanger ★★★★★
(18.01.20 22:27:53 MSK)

Ссылка

Ответ на: комментарий от hikikomori 17.01.20 23:06:51 MSK

И что я увижу? У меня «ТРЕВОГА!» в консоли загорится?)

Если настроишь - почта будет приходить

Pinkbyte ★★★★★
(19.01.20 14:03:58 MSK)

Ссылка

Ответ на: комментарий от hikikomori 17.01.20 23:57:09 MSK

от хранения на полке они тоже могут гикнуться просто так.

Винты - сильно вряд ли. SSD данные скорее всего потеряет, если долго держать без питания(в интернете писали что от полугода и выше многие модели данные уже теряют)

Pinkbyte ★★★★★
(19.01.20 14:05:53 MSK)

Ссылка

23 февраля 2020 г.

Ответ на: комментарий от Evenik 17.01.20 23:29:35 MSK

Сейчас буду менять в массиве диски на большего объёма, с 3 на 4Тб. Не знаю как быть, можно ли добавить в массив два новых диска, а после синхронизации удалить два старых, или такой фокус не пройдёт, и массив будет равен объёму старых дисков, даже когда они из него уйдут? Или объём массива сам увеличится до объёма новых накопителей, когда останутся только они?

В противном случае придется подымать ещё один рейд рядом и просто копировать с rsync.

hikikomori ★★★☆
(23.02.20 06:13:20 MSK) автор топика

Ответ на: комментарий от hikikomori 23.02.20 06:13:20 MSK

Не приходилось делать самому, но Гугл что-то находит с mdadm --grow ..., например: https://zackreed.me/mdadm-replace-smaller-disks-with-larger-ones/

Если хочешь советов, то лучше создать новую тему.

~~Evenik~~ ★★
(23.02.20 13:47:05 MSK)