Помогите выбрать ФС на несколько дисков в условный raid0

raid0

Собрал наконец то хлам с полки в многодисковый NAS из Raspberry Pi 1B, юсб-хаба и переходиков и старых дисков 20...80Гб, пока 3 штуки. Которые по отдельности абсолютно бесполезны, но все вместе с какой то натяжкой сойдут за трёхкилограмовую флешку длинной 550мм для чего нибудь второстепенного.

Теперь вопрос - мне не очень нравится как работает LVM при отвале одного из дисков, но ходят слухи что есть ФС (btrfs?), которые не только могут располагаться на нескольких устройствах сразу, но ещё и лучше распределяют файлы по ним так, что когда (в данном случае не если) что то отвалится - довольно много можно будет вытащить. Что можете посоветовать?

Перемещено hobbit из general

← Что делать со свопом?

Пометка битых секторов на массиве xfs? →

← 1 2 →

ZFS, btrfs. Других вариантов особо нет.

kaldeon ★★
(21.09.25 23:55:58 MSK)
Последнее исправление: kaldeon 21.09.25 23:56:12 MSK (всего исправлений: 1)

Ответ на: комментарий от kaldeon 21.09.25 23:55:58 MSK

А можно подробнее, какие возможности? Причём на малине с 512М памяти, по слухам zfs жутко прожорлива?

kirill_rrr ★★★★★
(21.09.25 23:57:14 MSK) автор топика

лучше распределяют файлы по ним так, что когда (в данном случае не если) что то отвалится - довольно много можно будет вытащить

Разве оно не зависит от структуры массива? На raid0, кажется, будет сложно что-то восстановить. Хотя бы зеркало сделать и тогда будет надёжно (данные будут записываться в два диска/группы одновременно).

kaldeon ★★
(21.09.25 23:59:08 MSK)

Ответ на: комментарий от kaldeon 21.09.25 23:59:08 MSK

Классичского зеркалирования на разнородной солянке не добиться. у меня вероятно будут диски 19, 74, 75, ~250, ~250 и возможно какая нибудь флешка ~59 гб. Да и тут бы объём по максимуму нарастить, надёжности всё равно ждать нет смысла. А так хоть торренты потаскать.

Я как то читал, что есть гибкие конфиги, которые в первую очередь кидают файлы целиком на 1 диск и держат в уме что один из томов отваливается и часть файлов сохраняется.

kirill_rrr ★★★★★
(22.09.25 00:04:53 MSK) автор топика

Ответ на: комментарий от kirill_rrr 21.09.25 23:57:14 MSK

Я не эксперт, просто поставил себе из-за репутации. Проект постарше btrfs и протестирован в полевых условиях.

По памяти может и влезет, но повлияет на производительность.

Я себе сделал зеркало. Одна и та же часть данных записывается в две группы, в каждой группе по два диска. Типа такого:

disk1 disk2 disk3 disk4
A     B     A     B
C     D     C     D

То есть избыточность не внутри группы, а между.

kaldeon ★★
(22.09.25 00:05:57 MSK)

Ответ на: комментарий от kirill_rrr 22.09.25 00:04:53 MSK

Для надёжности могут помочь чексуммы. Если любой файл повредится, то можно будет об этом узнать, запуская zfs scrub раз в месяц. Хороший способ как можно раньше заменить диск. Но если диск успеет прям полностью развалиться — хз.

Ну и бесплатная компрессия будет плюсом.

kaldeon ★★
(22.09.25 00:10:03 MSK)
Последнее исправление: kaldeon 22.09.25 00:10:43 MSK (всего исправлений: 2)

Ответ на: комментарий от kaldeon 22.09.25 00:05:57 MSK

Но ведь подобная черепичка требует одинакового размера томов!

kirill_rrr ★★★★★
(22.09.25 00:11:16 MSK) автор топика

Ответ на: комментарий от kaldeon 22.09.25 00:10:03 MSK

При прочих равных я бы предпочёл изучать btrfs. Она не требует сторонних модулей на ядро и уже включена в распбиан. Хотя сложная в управлении и понимании. Но кажется zfs не проще.

kirill_rrr ★★★★★
(22.09.25 00:12:59 MSK) автор топика

Да поднимай сразу ceph ну или пророк его minio

cobold ★★★★★
(22.09.25 00:16:27 MSK)

Ответ на: комментарий от kirill_rrr 22.09.25 00:11:16 MSK

Да, про это я забыл.

Но можно, например, разбить 4TB диск на 4 части и сделать зеркало на каждую часть с другим диском. Типа такого:

disk1     disk2   disk3   disk4   disk5
1GB part  mirror
1GB part          mirror
1GB part                  mirror
1GB part                          mirror

kaldeon ★★
(22.09.25 00:25:59 MSK)
Последнее исправление: kaldeon 22.09.25 00:29:13 MSK (всего исправлений: 2)

Ответ на: комментарий от kaldeon 22.09.25 00:25:59 MSK

Есть ещё одно ограничение: нельзя занимать 100% памяти (точную меру не знаю).

kaldeon ★★
(22.09.25 00:34:09 MSK)
Последнее исправление: kaldeon 22.09.25 00:34:29 MSK (всего исправлений: 1)

Ответ на: комментарий от cobold 22.09.25 00:16:27 MSK

и почему то чем дальше читаю, тем больше мне кажется что ceph - хорошее решение. Ну, пока я тупо не вижу ни одного подводного камня почему это не должно сработать, а возможность переконфигурировать всё на лету прям очень вкусная. А ещё он есть в распбиане.

kirill_rrr ★★★★★
(22.09.25 00:39:48 MSK) автор топика
Последнее исправление: kirill_rrr 22.09.25 00:40:30 MSK (всего исправлений: 1)

Ответ на: комментарий от kaldeon 22.09.25 00:10:03 MSK

Ещё надёжность на raid0 можно попробовать достичь за счёт copies=n. То есть кажется, что в случае первой ошибки чтения можно будет восстановить данные и выкинуть диск (только не на авито, пожалуйста).

Насколько я понимаю, диски могут умереть медленно или быстро, но постепенно. Можно обнаружить ошибку чтения и выкинуть диск. А вот флешки могут умереть в любой момент без предупреждения.

Про copies= я бы ещё этот блог почитал и эту (truenas.com) дискуссию. У самого куча хранилища, которое ни на что не годится и в случае флешек всё равно сдохнет через какое-то время. Кажется, что флешки можно организовать в зеркала, а на диски повесить copies=3.

kaldeon ★★
(22.09.25 00:40:07 MSK)
Последнее исправление: kaldeon 22.09.25 00:54:31 MSK (всего исправлений: 6)

Ответ на: комментарий от kirill_rrr 22.09.25 00:39:48 MSK

Это была штука, если что ) Там ресурсов нужно больше и работать будет медленно

cobold ★★★★★
(22.09.25 00:50:08 MSK)

Ответ на: комментарий от cobold 22.09.25 00:50:08 MSK

Скорость не важна. «больше» это сколько? И я ещё не понял, оперирование «объектами» как вяжется с деревом файлов и папок? Ну и тут упоминается главный OSD и реплики, кажется тут может оказаться что суммарное хранилище не больше главного OSD.

kirill_rrr ★★★★★
(22.09.25 00:55:19 MSK) автор топика

Seaweed FS

anonymous
(22.09.25 01:03:55 MSK)

Ответ на: комментарий от cobold 22.09.25 00:16:27 MSK

Я не девопс, но такое чувство, будто ceph — это скорее про ямл-программирование, оправданное в сценарии «нам нужно хранилище с таким-то объёмом, такой-то масштабируемостью, такой-то пропускной способностью и т.д., дай нам его, ничего не говоря о внутренней структуре». Для целей разделения труда в больших корпорациях это оправдано, а вот сидеть подбирать старые диски и флешки под абстрактные критерии, которые ещё неизвестно как в итоге стрельнут — это прям идеальный пример протекающей абстракции.

Вижу, что это шутка, но всё равно интересно.

kaldeon ★★
(22.09.25 01:04:27 MSK)
Последнее исправление: kaldeon 22.09.25 01:06:27 MSK (всего исправлений: 2)

Ответ на: комментарий от kaldeon 22.09.25 01:04:27 MSK

Во первых что то новое и интересное. Во вторых на хабре утверждают что он простой в простейшем случае.

нам нужно хранилище с таким-то объёмом, такой-то масштабируемостью, такой-то пропускной способностью и т.д.

А вот если упростить частный случай: пофигу на пропускную способность, а объём и масштабируемость пусть будут условно сложить все диски в один большой и сохранить каждый файл по 2 раза на разных дисках. Или вообще переключиться на лету в режим 1 копии.

kirill_rrr ★★★★★
(22.09.25 01:10:52 MSK) автор топика
Последнее исправление: kirill_rrr 22.09.25 01:12:59 MSK (всего исправлений: 1)

Ответ на: комментарий от kirill_rrr 22.09.25 00:39:48 MSK

А ещё он есть в распбиане.

А еще там 512MB. Я бы сказал «LVM, ext4 и не сношайте моск»

no-dashi-v2 ★★★★
(22.09.25 01:15:25 MSK)

Ответ на: комментарий от cobold 22.09.25 00:50:08 MSK

Ну ладно, первый вопрос конечно же «а сколько ей нужно оперативки»?

kirill_rrr ★★★★★
(22.09.25 01:16:18 MSK) автор топика

Ответ на: комментарий от no-dashi-v2 22.09.25 01:15:25 MSK

Что, неужели ничего лучше не придумали? Я её уже использую на Пи3 и на неделе как раз пропрыгался с нераскруткой одного диска в пуле 1Т+1Т.

kirill_rrr ★★★★★
(22.09.25 01:18:17 MSK) автор топика

mergerfs

No ★★★
(22.09.25 01:57:40 MSK)

Ответ на: комментарий от kirill_rrr 22.09.25 01:18:17 MSK

как раз пропрыгался с нераскруткой одного диска в пуле 1Т+1Т

Ну вообще надо помнить, что у каждого решения есть своя цена и ограничения. Например, нельзя просто брать и собирать RAID1 без одного участника в автоматическом режиме при загрузке (чревато потерей данных) - человеку «не в теме» это трудно понять, ведь у него же «два диска в зеркале, что может пойти не так».

Канонические энтерпрайзные методики на таком говне не работают. Модные хипстерские цефы тоже - сорян, но на 512 мегабайтах цеф даже не запустится. Особенно с учетом 3 дисков.

LVM с его рейдом позволит на этом говне поднять зеркало которое переживает отказ любого одного диска и даст максимум из возможного объема, типа если у тебя три диска 20-40-80 то вполне можно будет построить 60GB зеркалированных.

no-dashi-v2 ★★★★
(22.09.25 02:06:39 MSK)

Я сам, если что, использую диски без всяких RAID, синхронизирую реплику rsync’ом в рамках одной ноды - 2ТБ реплицированного объема и 6ТБ так, без реплики под торренты. Не потому, что памяти мало, а потому, что накушался всей этой хрени.

no-dashi-v2 ★★★★
(22.09.25 02:09:47 MSK)

Ответ на: комментарий от no-dashi-v2 22.09.25 02:09:47 MSK

Ну, будь тут диски хотя бы по 500Гб, я и руками не обломался бы балансировать... А тут я просто затрахаюсь на ровном месте. Короче похоже надо выбирать между lvm raid0 и btrfs, ну после того как дочитаю про всё что тут посоветовали.

kirill_rrr ★★★★★
(22.09.25 02:19:41 MSK) автор топика

Ответ на: комментарий от kirill_rrr 22.09.25 02:19:41 MSK

Если остановишься на btrfs, выбирай для данных профиль single, из него потом есть шанс мелочь восстановить, в отличие от raid0. Да и в последнем данные пишутся 1 к 1 на все диски, то есть по началу будет равномерно всё ложиться, пока меньший диск не забьётся целиком. А вот raid0 в zfs раскладывает равномерно в зависимости от размеров дисков.

kneedeep ★
(22.09.25 02:47:53 MSK)
Последнее исправление: kneedeep 22.09.25 02:52:08 MSK (всего исправлений: 1)

Ответ на: комментарий от kaldeon 22.09.25 00:05:57 MSK

Я себе сделал зеркало. Одна и та же часть данных записывается в две группы, в каждой группе по два диска. Типа такого:

disk1 disk2 disk3 disk4
A B A B
C D C D

Это raid10 называется.

firkax ★★★★★
(22.09.25 08:57:06 MSK)

raid0 даст преимущество только при параллельном доступе к файлам, при последовательном доступе к файлу диски будут работать по очереди, а не все сразу, что даст негативный эффект по скорости и надёжности.
btrfs вполне подойдёт, её можно конвертировать в другой тип без переформатирования, можно любую фс через md, но их преобразовать не получится.

~~ext4~~
(22.09.25 09:12:01 MSK)

Ответ на: комментарий от kirill_rrr 22.09.25 00:04:53 MSK

Классичского зеркалирования на разнородной солянке не добиться

Вот именно использованием LVM этого добиться очень просто, поскольку там зеркалируются не диски, а логические тома, которые можно сделать любого размера и распихать как угодно. Например, половина зеркала - на одном устройстве, вторая - на двух других, куда влезло.

anonymous
(22.09.25 09:20:11 MSK)

Может быть snapraid? (https://www.snapraid.it/)

MirandaUser2 ★★
(22.09.25 12:17:03 MSK)

Ответ на: комментарий от kirill_rrr 22.09.25 02:19:41 MSK

А зачем там «балансировать». Грубо говоря у тебя диски 20, 40 и 80ГБ (например) и зовутс они sda, sdb и sdc.

Создаешь на всех трех дисках раздел размером во весь диск с типом LVM PV.

Создаешь на все три диска VG (vgcreate test /dev/sda1 /dev/sdb1 /dev/sdc1)

Затем создаешь LV:

lvcreate –type raid1 -m 1 -n lvname -L 20G /dev/sda1 /dev/sdc1

И потом его расширяешь

lvchange /dev/test/mylv -L +40G /dev/sdb1 /dev/sdc1

Собсно всё, вот тебе 60GB в зеркале, отказ одного диска переживет легко. И ничего «балансировать» не надо. И еще 20GB останется без зеркала. LVM тем и хорош что он кастомизируется хорошо.

no-dashi-v2 ★★★★
(22.09.25 13:11:50 MSK)

Ответ на: комментарий от no-dashi-v2 22.09.25 13:11:50 MSK

Создаешь на все три диска VG (vgcreate test /dev/sda1 /dev/sdb1 /dev/sdc1)

теоретически, надо упомянуть, что диски в группе должны быть с одинаковым размером логического сектора (512 или 4K), иначе могут быть подводные камни. (вряд ли на старых дисках есть 4K, но вдруг.)

anonymous
(22.09.25 14:27:56 MSK)

Ответ на: комментарий от anonymous 22.09.25 14:27:56 MSK

Ну найти диск на котором logical sector size не 512 по умолчанию это надо постараться

no-dashi-v2 ★★★★
(22.09.25 16:38:32 MSK)

Пока что попробую ехт4+mergerfs как самый примитивный вариант общей свалки.

Когда пойму что мне надо запихнуть 1 файл на все диски или когда докину портов с 3 до 5-6-7 дисков - тогда попробую snapraid или многодисковую btrfs, в зависимости от того сколько места потеряю на диске чётности.

kirill_rrr ★★★★★
(22.09.25 17:07:20 MSK) автор топика

Ответ на: комментарий от MirandaUser2 22.09.25 12:17:03 MSK

Стоп, а он что, реально перестраивает контрольные суммы чётности только после пинка вручную?

kirill_rrr ★★★★★
(22.09.25 17:22:44 MSK) автор топика

странно что еще никто не посоветовал jbod

slowpony ★★★★★
(22.09.25 18:11:18 MSK)

На всякий случай, у RAID0 фича не в размере, это просто побочный эффект такой.

~~mx__~~ ★★★★★
(22.09.25 18:25:35 MSK)

Ответ на: комментарий от mx__ 22.09.25 18:25:35 MSK

Как может быть фича не в размере для штуки, которая делает размер1 + размер2?

kirill_rrr ★★★★★
(22.09.25 18:57:34 MSK) автор топика

Ответ на: комментарий от slowpony 22.09.25 18:11:18 MSK

Так это же и есть lvm raid0 без специальной настройки черепичности.

kirill_rrr ★★★★★
(22.09.25 19:02:06 MSK) автор топика

Ответ на: комментарий от mx__ 22.09.25 18:25:35 MSK

На всякий случай, у RAID0 фича не в размере, это просто побочный эффект такой.

Да-да, так и есть, эт потом его всякие нерды по незнанию стали пользовать только для увеличения размера.

anc ★★★★★
(22.09.25 20:07:02 MSK)

Ответ на: комментарий от anc 22.09.25 20:07:02 MSK

только для увеличения размера.

Только я не понял, если нужен только размер, то при LVM зачем RAID0 то нужен?

~~mx__~~ ★★★★★
(23.09.25 06:16:50 MSK)

Ответ на: комментарий от no-dashi-v2 22.09.25 13:11:50 MSK

lvcreate –type raid1 -m 1 -n lvname -L 20G /dev/sda1 /dev/sdc1

По моему это так не пашет. Нужно мне инет почитать … но я не знал что при создании lv можно указывать что то другое от vg.

~~mx__~~ ★★★★★
(23.09.25 06:28:45 MSK)

Зачем условный? mdraid + ext4 и вперёд.

CrX ★★★★★
(23.09.25 06:31:43 MSK)

Ответ на: комментарий от no-dashi-v2 22.09.25 13:11:50 MSK

Почитал инет, оказывается так тоже работает. Но в:

lvcreate –type raid1 -m 1 -n lvname -L 20G /dev/sda1 /dev/sdc1

Все таки vg указать нужно.

Но в:

Затем создаешь LV:

lvcreate –type raid1 -m 1 -n lvname -L 20G /dev/sda1 /dev/sdc1

И потом его расширяешь

lvchange /dev/test/mylv -L +40G /dev/sdb1 /dev/sdc1

все таки какая то логическая ошибка есть. Только не пойму где ;(

P.S. Я бы sda1+sdb1 запихал бы raid0 = md0
а потом бы сделал lvm-raid1 = md0 + sdc1.

~~mx__~~ ★★★★★
(23.09.25 06:51:19 MSK)
Последнее исправление: mx__ 23.09.25 07:14:21 MSK (всего исправлений: 2)

Ответ на: комментарий от mx__ 23.09.25 06:51:19 MSK

указание физических томов в командах типа lvresize говорит, куда этот том надо расширить (или откуда убрать). можно их не указывать, тогда место выделится автоматически в соответствии с заданной allocation policy. при желании оно может и зеркало на том же устройстве создать.

anonymous
(23.09.25 07:30:47 MSK)

Ответ на: комментарий от anonymous 23.09.25 07:30:47 MSK

указание физических томов в командах типа

Я уже прочитал по этому поводу, но все равно нужно указывать vg а у него в примере этого нет.

И потом, вот это:

lvchange /dev/test/mylv -L +40G /dev/sdb1 /dev/sdc1

Вообще не раздупляю :( Оно что автоматом sda1 расширит на 40 только задействовав /dev/sdb1 ? А sdc1 только в sdc1. Что то слишком умно выходит.

~~mx__~~ ★★★★★
(23.09.25 07:37:55 MSK)
Последнее исправление: mx__ 23.09.25 07:38:44 MSK (всего исправлений: 1)

zfs. но не шустро

Belen ★★
(23.09.25 10:43:32 MSK)

Ответ на: комментарий от kirill_rrr 21.09.25 23:57:14 MSK

512 конечно мало. но отключить дедупликацию (основной потребитель памяти) да и компрессию до кучи… и поползёт помаленьку

Belen ★★
(23.09.25 10:46:43 MSK)

Ответ на: комментарий от mx__ 23.09.25 07:37:55 MSK

Вообще не раздупляю :( Оно что автоматом sda1 расширит на 40 только задействовав /dev/sdb1 ? А sdc1 только в sdc1. Что то слишком умно выходит.

sd? это названия физических томов. расширит он на них логический mylv.

anonymous
(23.09.25 11:15:39 MSK)

Ответ на: комментарий от anonymous 23.09.25 11:15:39 MSK

sd? это названия физических томов. расширит он на них логический mylv.

Из чего видно что sdc1 не расширит на sdb1?

~~mx__~~ ★★★★★
(23.09.25 11:20:44 MSK)

← 1 2 →

← Что делать со свопом?

Admin

Пометка битых секторов на массиве xfs? →

Похожие темы