RAIDZ1 vs ZFS Mirror vs RAID1

2

4

Вникаю в тему избыточности для сохранения данных и не понимаю, кому и чему верить.

Во-первых, какие преимущества есть у ZFS Mirror перед RAID1 (здесь и далее под RAID я имею ввиду софтварный рейд, а под ZFS имею ввиду OpenZFS во FreeBSD и производных)? На тематических форумах по BSD и NAS приводят в качестве основного преимущества то, что ты сразу получаешь ФС, а не просто блочный девайс, но разве это преимущество? На блочный девайс я могу любую нужную мне ФС поставить. Или тут еще что-то скрыто? Вроде минус один уровень между железом и файлами.

Во-вторых, не могу определиться с тем, какой из ZFS RAID использовать. С одной стороны есть простое зеркало, о котором тут пишут, что это якобы наиболее производительный вариант при хранении больших файлов (недостаток с эффективным объем свободного места в <=50% от суммы объемов дисков пока не принимаем в расчет). А вот тут товарищ проводит тестирование различных ZFS RAID, по результатам которого понятно, что как раз зеркало самое НЕпроизводительное и вообще самое худшее получается. Кому верить?

В-третьих, не совсем понятно, как отражается на производительности выбытие из пула из одного RAIDZ1 одного диска из трех или более. Где-то пишут, что это сильно снизит производительность, при этом RAIDZ1 и RAIDZ2 являются самыми используемыми. Где подвох? Если, допустим, на RAIDZ1 из трех дисков выбывает один и это не сильно бьет по производительности на время замены диска, то, наверное, лучше выбрать 2xRAIDZ1 по 3 диска, чем добавлять в один RAIDZ1 еще диски.

В конечном итоге хочется получить масштабируемое с минимальными затратами хранилище, у которого будет хорошая производительность по крайней мере на чтение (точно не ниже чтения с одного диска). Что подскажете?

Ссылка

←	Файловые дескрипторы

Fedora 25 перестала работать смена раскладки на клавиатуре

→

Mirror — это RAID1, только лучше. RAIDZ — это RAID5/6, только лучше.

«Только лучше» заключается в том, что ZFS умеет:

обнаруживать тихие ошибки за счёт чексумм,
не перестраивать пустое пространство при сбое, и
обходиться без write hole.

intelfx ★★★★★
(20.01.20 19:48:46 MSK)

Ответ на: комментарий от intelfx 20.01.20 19:48:46 MSK

обходиться без write hole

А почему это плюс?

Deleted
(20.01.20 19:51:25 MSK)

Ответ на: комментарий от intelfx 20.01.20 19:48:46 MSK

обнаруживать тихие ошибки за счёт чексумм

Что за «тихие» ошибки не понял, но это относится к ZFS как к ФС. Но тоже самое можно сделать и с самой обычной ext4, так? Отслеживать ошибки, запуская fsck. На других ФС тоже есть инструменты для проверки и исправления ошибок.

не перестраивать пустое пространство при сбое

О каких сбоях идет речь? Сбой самой ФС или аппаратные тоже?

exfx
(20.01.20 19:53:46 MSK) автор топика

ZFS RAID 10 + cache

~~Rx0~~
(20.01.20 20:02:20 MSK)

Ответ на: комментарий от exfx 20.01.20 19:53:46 MSK

Что за «тихие» ошибки не понял, но это относится к ZFS как к ФС. Но тоже самое можно сделать и с самой обычной ext4, так?

Речь идет об ошибках на уровне блоков RAID5/6, а не уровне FS. ZFS имеет дополнительные механизмы контроля целостности массива по сравнению с классическими RAID5/6.

Serge10 ★★★★★
(20.01.20 20:25:35 MSK)

Ссылка

Ответ на: комментарий от exfx 20.01.20 19:53:46 MSK

О каких сбоях идет речь?

Вылет диска с последующей заменой и перестройкой массива.

Serge10 ★★★★★
(20.01.20 20:26:49 MSK)

Ссылка

RAIDZ1 или RAIDZ2 на 4-х или 5-и дисках.

iZEN ★★★★★
(20.01.20 20:29:31 MSK)

Ссылка

Ответ на: комментарий от Deleted 20.01.20 19:51:25 MSK

Write hole — это ситуация (возникающая при крахе системы в процессе записи), в которой новые данные успели записаться, а parity ещё нет. Если это вовремя не задетектить и не пересчитать parity, для данного страйпа нарушается гарантия избыточности (т. е. в случае смерти диска страйп восстановить не получится).

Плюс в том, что в ZFS такая ситуация возникнуть не может (а, например, в btrfs или в классическом md без журнала — может).

intelfx ★★★★★
(20.01.20 20:34:32 MSK)

Ответ на: комментарий от exfx 20.01.20 19:53:46 MSK

Что за «тихие» ошибки не понял

Искажения отдельных битов внутри сектора, не обнаружимые средствами самого диска (т. е. не приводящие к отметке сектора как плохого).

Но тоже самое можно сделать и с самой обычной ext4, так? Отслеживать ошибки, запуская fsck.

Нет, не так.

О каких сбоях идет речь? Сбой самой ФС или аппаратные тоже?

Как написали выше — вылет диска с перестроением массива. Т. е. о тех сбоях, от которых и защищает RAID.

intelfx ★★★★★
(20.01.20 20:36:27 MSK)
Последнее исправление: intelfx 20.01.20 20:37:05 MSK (всего исправлений: 1)

Ответ на: комментарий от intelfx 20.01.20 20:34:32 MSK

А, блин, я это спутал с чем-то другим) А почему в Btrfs такое возможно?

Deleted
(20.01.20 20:37:02 MSK)

Ответ на: комментарий от Deleted 20.01.20 20:37:02 MSK

Потому что в Btrfs слой файловой системы работает поверх слоя RAID, как в классическом md, а не наоборот.

Грубо говоря, у тебя весь многодисковый том бьётся на много маленьких разделов (chunks), поверх групп этих чанков создаётся обычный классический RAID, а поверх получившихся виртуальных разделов (blockgroups) уже работает btrfs со всей её атомарностью, CoW и прочим.

intelfx ★★★★★
(20.01.20 20:39:58 MSK)
Последнее исправление: intelfx 20.01.20 20:41:47 MSK (всего исправлений: 2)

Ответ на: комментарий от intelfx 20.01.20 20:39:58 MSK

Это печально

Deleted
(20.01.20 20:42:14 MSK)

Ссылка

intelfx, Serge10, спасибо, о преимуществах я понял. Но вопрос производительности и выбора между mirror и raidz1 пока не решен. Есть у кого реальный опыт в сравнении на реальном железе в реальных юзкейсах? Или может быть достоверный источник, которому можно доверять. Я, конечно, в итоге и сам проведу сравнение на своем железе, но мне надо понимать, сколько дисков брать и какого объема в зависимости от mirror или raidz1.

exfx
(20.01.20 20:49:58 MSK) автор топика

Ответ на: комментарий от exfx 20.01.20 20:49:58 MSK

Есть у кого реальный опыт в сравнении на реальном железе в реальных юзкейсах?

например https://blog.lexa.ru/tags/zfs

zendrz ★★
(20.01.20 20:54:23 MSK)

Ссылка

Ответ на: комментарий от exfx 20.01.20 20:49:58 MSK

Основной недостаток raidz (не только raidz, а вообще любых RAID с чётностью) — в том, что они медленно перестраивается. Выбирая количество дисков с чётностью, исходи из MTBF и nonrecoverable read error rate твоих дисков — иначе может получиться так, что пока ты будешь перестраивать массив, у тебя навернётся второй диск или случится ещё один битфлип.

Ещё один недостаток raidz применительно к конкретно ZFS состоит в том, что в ZFS нет и никогда не будет рестрайпа. Т. е. если ты создашь raidz-массив из (например) трёх дисков, ты не сможешь добавить к ним четвёртый, чтобы получился raidz из четырёх дисков.

Ну а преимущество у raidz в общем-то одно — ему нужно меньше дисков для достижения того же самого уровня избыточности.

intelfx ★★★★★
(20.01.20 21:43:57 MSK)
Последнее исправление: intelfx 20.01.20 21:45:36 MSK (всего исправлений: 2)

Ссылка

Ответ на: комментарий от intelfx 20.01.20 19:48:46 MSK

RAIDZ — это RAID5/6, только лучше

Хрен там оно лучше. Это я как пользователь ZFS говорю.

Аргументы ищите сами, мне лень пересказывать тему, которую уже тысячу раз обсосали.

mord0d ★★★★★
(20.01.20 22:01:32 MSK)

Ответ на: комментарий от exfx 20.01.20 20:49:58 MSK

mirror или raidz1

RAID-1 работает со скоростью самого медленного диска в пуле.

mord0d ★★★★★
(20.01.20 22:03:38 MSK)

Ответ на: комментарий от Rx0 20.01.20 20:02:20 MSK

ZFS RAID 10 + cache

С некоторыми оговорками:

cache на SSD;
RAID-1 размазан по разным дискам;
RAID-0 размазан по разным дискам.

mord0d ★★★★★
(20.01.20 22:06:24 MSK)

Ссылка

Ответ на: комментарий от mord0d 20.01.20 22:01:32 MSK

Хрен там оно лучше.

Лучше-лучше. Это я как пользователь ZFS говорю :)

Deleted
(20.01.20 22:49:10 MSK)

Ответ на: комментарий от Deleted 20.01.20 22:49:10 MSK

Хрен там оно лучше.

Лучше-лучше. Это я как пользователь ZFS говорю :)

Kakije vashi dokazatelstva?

Нену, если в сравнении с хардварными RAID-5/RAID-6, то вполне может быть, у меня с ними дружба не сложилась с самого начала.

mord0d ★★★★★
(20.01.20 23:08:16 MSK)

Ответ на: комментарий от mord0d 20.01.20 23:08:16 MSK

Kakije vashi dokazatelstva?

Cocainum! :))

Да, собственно, выше написали уже всё. Лучше аппаратных железок и mdadm.

Deleted
(20.01.20 23:35:54 MSK)

Ответ на: комментарий от intelfx 20.01.20 20:39:58 MSK

Потому что в Btrfs слой файловой системы работает поверх слоя RAID

Разве? https://btrfs.wiki.kernel.org/index.php/Using_Btrfs_with_Multiple_Devices

Nastishka ★★★★★
(20.01.20 23:39:19 MSK)

Ответ на: комментарий от mord0d 20.01.20 22:03:38 MSK

RAID-1 работает со скоростью самого медленного диска в пуле.

Уточним - на запись.

Nastishka ★★★★★
(20.01.20 23:40:07 MSK)

Ответ на: комментарий от exfx 20.01.20 20:49:58 MSK

for a given number of disks, a pool of mirrors will significantly outperform a RAIDZ stripe.

a degraded pool of mirrors will severely outperform a degraded RAIDZ stripe.

a degraded pool of mirrors will rebuild tremendously faster than a degraded RAIDZ stripe.

a pool of mirrors is easier to manage, maintain, live with, and upgrade than a RAIDZ stripe.

https://jrs-s.net/2015/02/06/zfs-you-should-use-mirror-vdevs-not-raidz/

Harliff ★★★★★
(21.01.20 00:00:39 MSK)
Последнее исправление: Harliff 21.01.20 00:01:22 MSK (всего исправлений: 2)

Ответ на: комментарий от Nastishka 20.01.20 23:39:19 MSK

Внутри Btrfs.

Я же описал подробно, как это работает.

intelfx ★★★★★
(21.01.20 00:02:23 MSK)

Ссылка

Ответ на: комментарий от Harliff 21.01.20 00:00:39 MSK

Да хватит уже совать эту статью везде. Там на три тонны воды ровно один простой как палка тезис: (любой) RAID с чётностью медленнее, чем тупое зеркало. Ну да, медленнее. Вот это поворот.

intelfx ★★★★★
(21.01.20 00:03:48 MSK)

Ссылка

Ответ на: комментарий от Deleted 20.01.20 23:35:54 MSK

Лучше аппаратных железок и mdadm.

Покажи zpool status своего пула на RAIDZ? Интересует, только структура (config), остальное можешь тримнуть.

mord0d ★★★★★
(21.01.20 00:08:54 MSK)

Ответ на: комментарий от intelfx 20.01.20 20:36:27 MSK

Искажения отдельных битов внутри сектора, не обнаружимые средствами самого диска (т. е. не приводящие к отметке сектора как плохого).

а как реализуется проверка? Постоянно перепрочитывается в простое?

targitaj ★★★★★
(21.01.20 00:10:12 MSK)

Ответ на: комментарий от Nastishka 20.01.20 23:40:07 MSK

RAID-1 работает со скоростью самого медленного диска в пуле.

Уточним - на запись.

И "холодное" чтение.

А учитывая, что на всём ЛОРе ARC умеют нормально тюнить всего полтора человека (я в этот список не вхожу)…

mord0d ★★★★★
(21.01.20 00:10:57 MSK)

Ответ на: комментарий от mord0d 21.01.20 00:08:54 MSK

Есть обычные z2 и z3, что там можно увидеть то? :) У всех одинаково всё (linux/freebsd/solaris)

Deleted
(21.01.20 00:11:06 MSK)

Ответ на: комментарий от Deleted 21.01.20 00:11:06 MSK

Интересно количество дисков. ☺

mord0d ★★★★★
(21.01.20 00:14:45 MSK)

Ответ на: комментарий от targitaj 21.01.20 00:10:12 MSK

Контрольные суммы.

intelfx ★★★★★
(21.01.20 00:15:48 MSK)

Ссылка

По скорости быстрее всех будет bcache+mdadm. По надежности zfs.

Deleted
(21.01.20 00:16:50 MSK)

Ссылка

Ответ на: комментарий от mord0d 21.01.20 00:14:45 MSK

В основном 8

Deleted
(21.01.20 00:17:19 MSK)

Ответ на: комментарий от Deleted 21.01.20 00:17:19 MSK

В основном 8

Мне такая роскошь (пока) недоступна. Я только недавно заменил бракованный(?) блок питания, запитывание от которого более трёх дисков регулярно било данные/метаданные из-за рандомного отвала питания на некоторые шлейфы.

mord0d ★★★★★
(21.01.20 00:24:33 MSK)

Ссылка

Ответ на: комментарий от mord0d 21.01.20 00:10:57 MSK

на всём ЛОРе ARC умеют нормально тюнить всего полтора человека

Дай сурс на тюнинг, интересно почитать чего там тюнить кроме min/max.

~~King_Carlo~~ ★★★★★
(21.01.20 00:30:54 MSK)

Ответ на: комментарий от King_Carlo 21.01.20 00:30:54 MSK

ARC могут тюнить не только лишь все !

Deleted
(21.01.20 12:34:16 MSK)

Ссылка

Ответ на: комментарий от King_Carlo 21.01.20 00:30:54 MSK

Да и то в 0.8 по-умолчанию сделали всё:

https://zfsonlinux.org/manpages/0.8.0/man5/zfs-module-parameters.5.html

zfs_arc_max (ulong)
Max arc size of ARC in bytes. If set to 0 then it will consume 1/2 of system RAM. This value must be at least 67108864 (64 megabytes).
This value can be changed dynamically with some caveats. It cannot be set back to 0 while running and reducing it below the current ARC size will not cause the ARC to shrink without memory pressure to induce shrinking.
Default value: 0.
zfs_arc_min (ulong)
Min arc size of ARC in bytes. If set to 0 then arc_c_min will default to consuming the larger of 32M or 1/32 of total system memory.
Default value: 0.

Deleted
(21.01.20 22:13:06 MSK)

Ссылка

масштабируемое

RAIDZ +
MD +
hardware RAID -

минимальными затратами

RAIDZ +
MD +
hardware RAID -

хорошая производительность по крайней мере на чтение (точно не ниже чтения с одного диска)

RAIDZ +
MD +
hardware RAID +

Безопасность данных лучше всего обеспечивает zfs, но за это приходится платить производительностью. Если у тебя меньше чем 8 гб оперативки - то лучше не надо zfs. Советую попробывать всё варианты и понять что тебе надо. Лично я предпочитаю RAIDZ1.

sky92
(21.01.20 23:48:22 MSK)

Ответ на: комментарий от sky92 21.01.20 23:48:22 MSK

Если у тебя меньше чем 8 гб оперативки - то лучше не надо zfs.

Ух, как требования подросли. Раньше нужно было не меньше 4 ГБ и процессор уровня Intel Atom.

iZEN ★★★★★
(22.01.20 01:26:08 MSK)

Ответ на: комментарий от iZEN 22.01.20 01:26:08 MSK

Я даже не представляю как можно уместить всё ПО и ARC в 4гб ОЗУ.. Сейчас любое более менее известное приложение на яве запустишь минус 2-4гб минимум.

sky92
(22.01.20 01:41:07 MSK)

Ответ на: комментарий от sky92 22.01.20 01:41:07 MSK

Запустил NetBeans 11.2, а в ней демонстрационный проект собрал и запустил — на всё ушло 1,2 ГБ ОЗУ. Запустил RSSOwl почитать новости — ещё откусило 300 МБ. Откуда «2-4гб минимум»?

iZEN ★★★★★
(22.01.20 01:52:27 MSK)
Последнее исправление: iZEN 22.01.20 01:53:07 MSK (всего исправлений: 1)

Ответ на: комментарий от iZEN 22.01.20 01:52:27 MSK

Вот к примеру уже сжирает https://docs.gitlab.com/ee/install/requirements.html

Виртуалки, докер под проекты.

sky92
(23.01.20 01:51:35 MSK)

Ответ на: комментарий от sky92 23.01.20 01:51:35 MSK

Сравнивать десктопное приложение и серверное — некорректно.

Те, кто умеет в настройку GC в JVM, понимают, что пресловутые требования в значительной степени взяты с потолка.

Bass ★★★★★
(23.01.20 02:22:16 MSK)

Ответ на: комментарий от Bass 23.01.20 02:22:16 MSK

А кто их сравнивает то? Спросили куда 2-4 гб деваются - ответил. К тому же лично я не буду на свой NUC с одним ssd ставить zfs. Просто незачем мне он тут. Все важные данные я не храню на декстопе, для этого есть другие машины. Десктоп для хлама и разработки, а не для хранения данных. Поэтому немного недоумеваю когда люди с одним хардом ставят зфс корневой фс и хранят хлам торрент-сериалов и мемов на нём(надо еще компрессию включать на jpeg/mp4/* и дедупликацию туда же на 4 гб RAM, чтобы комбо). Всему своё место как по мне.

sky92
(23.01.20 22:04:30 MSK)

Ссылка

30 сентября 2020 г.

Ответ на: комментарий от sky92 21.01.20 23:48:22 MSK

Приветствую. Так получилось что последние 5 лет не занимался FreeBSD и слегка подзабыл что там с ZFS, в общем есть сервер с 8 гиг оперативки (старый ксен, больше не ставить) там есть сата 6 портов, есть 5 одинаковых винтов SATA можно прикупить SSD под кеш, с SSD отдельная печальная история, я узнал что такое SLC кеш на горьком опыте :( …Так вот, что лучше замутить на этом железе ? RAID0+1 или RAIDZ и ещё если взять SSD на терабайт, в нём кеша 32гига всего, разметить этот SSD одним кусочком в эти 32 гига, можно ли этот кусочек под кеш использовать ?

nagual
(30.09.20 19:19:59 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Файловые дескрипторы

General

Fedora 25 перестала работать смена раскладки на клавиатуре

→

Похожие темы