Линус Торвальдс высказался о ZFS

4

5

В процессе обсуждения планировщиков ядра Linux пользователь Джонатан Данти пожаловался, что изменения в ядре сломали важный сторонний модуль — ZFS. Вот что написал в ответ Торвальдс:

Имейте в виду, что тезис «мы не ломаем пользователей» относится к программам пространства пользователя и к ядру, которое я сопровождаю. Если вы добавляете сторонний модуль вроде ZFS, то вы сами по себе. У меня нет возможности поддерживать такие модули, и я не отвечаю за их поддержку.

И, откровенно говоря, я не увижу ни одного шанса на включение ZFS в ядро, пока не получу официальное сообщение от Oracle, заверенное их главным юрисконсультом или, лучше всего, самим Ларри Эллисоном, в котором говорится, что всё ок, и ZFS теперь под GPL.

Некоторые думают, что добавить код ZFS к ядру — неплохая идея, и что интерфейс модуля нормально с этим справляется. Что ж, это их мнение. Я же не чувствую такое решение надёжным, учитывая спорную репутацию Oracle и проблемы, связанные с лицензированием.

Поэтому мне абсолютно неинтересны штуки вроде «слоёв совместимости ZFS», которые, как некоторые думают, изолируют Linux и ZFS друг от друга. Нам от этих слоёв никакой пользы, а учитывая склонность Oracle судиться из-за использования их интерфейсов — я не думаю, что это реально решает проблемы с лицензиями.

Не используйте ZFS. Вот и всё. По-моему, ZFS это больше баззворд, чем что-то ещё. Проблемы с лицензированием — только ещё одна причина, почему я никогда не стану заниматься этой ФС.

Все бенчмарки производительности ZFS, что я видел, совершенно не впечатляют. И, как я понимаю, ZFS уже даже толком не сопровождается, и никакой долгосрочной стабильностью здесь не пахнет. Зачем вообще её использовать?

>>> Подробности

Ссылка

← Релиз OpenWRT 19.07

Релиз встраиваемой системы реального времени Embox v0.4.0 →

← 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 →

Ответ на: комментарий от mv 12.01.20 18:15:51 MSK

что с ~~a_buchinskiy~~ случилось под конец треда? анонимы развели его на говно (и модеры радостно забанили) или он сам не выдержал, выложил пароль и попросил его заблокировать?

~~crypt~~ ★★★★★
(13.01.20 15:03:25 MSK)

Ответ на: комментарий от intelfx 12.01.20 18:16:25 MSK

~~crypt~~ ★★★★★
(13.01.20 15:03:40 MSK)
Последнее исправление: crypt 13.01.20 15:03:55 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от crypt 13.01.20 15:03:25 MSK

Увезли на принудительное лечение

Deleted
(13.01.20 15:05:27 MSK)

Ответ на: комментарий от Deleted 13.01.20 15:05:27 MSK

не выдержал, значит... вот что бывает, когда слишком долго с вами на лоре общаешься:)

~~crypt~~ ★★★★★
(13.01.20 15:05:53 MSK)

Ответ на: комментарий от crypt 13.01.20 15:05:53 MSK

Вот что бывает, когда спецслужбы устраивают электромагнитные атаки на мозг))

Deleted
(13.01.20 15:08:11 MSK)

Ответ на: комментарий от Deleted 13.01.20 15:08:11 MSK

Он ещё вернётся под другим ником, а то и не под одним (как было уже 100500 раз), шиза не даст покоя.

Deleted
(13.01.20 15:23:44 MSK)

Ссылка

Ответ на: комментарий от crypt 13.01.20 15:03:25 MSK

что с a_buchinskiy случилось под конец треда? анонимы развели его на говно (и модеры радостно забанили) или он сам не выдержал, выложил пароль и попросил его заблокировать?

Его провода оказались слишком длинными…

mv ★★★★★
(13.01.20 17:14:10 MSK)

Ссылка

Ответ на: комментарий от Deleted 10.01.20 11:29:40 MSK

оно даже в зародышевом состоянии почти всегда быстрее, чем ZFS

нихрена не умеет, но делает это очень быстро

dummy ★★
(13.01.20 17:54:48 MSK)

Ссылка

Ответ на: комментарий от hobbit 10.01.20 11:29:55 MSK

у меня тут проблемка с телепортацией…

ссылку, сестра

~~crypt~~ ★★★★★
(13.01.20 19:37:29 MSK)
Последнее исправление: crypt 13.01.20 19:38:04 MSK (всего исправлений: 1)

Ответ на: комментарий от crypt 13.01.20 19:37:29 MSK

https://www.youtube.com/watch?v=46elR2khqCA

hobbit ★★★★★
(13.01.20 20:54:52 MSK)

Ответ на: комментарий от hobbit 13.01.20 20:54:52 MSK

у меня всегда проблема с этим сериалом была. и сейчас то же. полчаса назад смотрел несколько сборок («самые смешные моменты»). сосредоточенно и очень внимательно. не смешно. совсем. все «про войну», то есть поправде. :)

~~crypt~~ ★★★★★
(13.01.20 21:25:26 MSK)

Ответ на: комментарий от crypt 13.01.20 21:25:26 MSK

На мой взгляд, этот момент — лучший.

Соперничать с ним может только фантазия на тему кота Шрёдингера в финале 1 сезона. :) (Но там любовь-морковь, не всем понравится.)

hobbit ★★★★★
(13.01.20 21:27:22 MSK)
Последнее исправление: hobbit 13.01.20 21:27:53 MSK (всего исправлений: 1)

Ответ на: комментарий от hobbit 13.01.20 21:27:22 MSK

даже не знаю почему)

~~crypt~~ ★★★★★
(13.01.20 21:29:36 MSK)

Ссылка

Ответ на: комментарий от LongLiveUbuntu 13.01.20 13:27:30 MSK

Так сказано же уже не один раз, что нужность сабжа на онтопике весьма сомнительна

sehellion ★★★★★
(13.01.20 21:51:10 MSK)

Ссылка

Ответ на: комментарий от anonymous 13.01.20 06:16:22 MSK

Потому что денег хочется а торговать нечем. А потом на вопросы пользователей «у меня две базы на апплаенсе а оно тормозит хуже андроида» в ответ тишина

Nastishka ★★★★★
(13.01.20 23:49:29 MSK)

Ссылка

Ответ на: комментарий от anonymous 13.01.20 08:53:18 MSK

В новое место пишется вообще всё и всегда. Просто без снапшота оно сразу помечается свободным и может заиспользовано снова для следующих записей. К плохому - к тому что последовательные операции которые могли делаться в одно чтение делаются в несколько. Это не особо заметно на ссд но на хдд очень даже. Можете посмотреть spec sfs где на большой параллельности all flash zfs сливает хдд

Nastishka ★★★★★
(13.01.20 23:56:07 MSK)

Ссылка

Ответ на: комментарий от sky92 11.01.20 01:09:13 MSK

Вот простой эксперемент можно провести : собираем sdb sdc в raid1

Собирай в raid-5/6, в нём сами данные равносильны контрольной сумме.

mv ★★★★★
(14.01.20 00:20:18 MSK)

Ответ на: комментарий от mv 14.01.20 00:20:18 MSK

В zfs raid1 уже делает это. Зачем мне юзать 3 диска, когда можно 2? Ладно, raid5 мне больше по душе если честно, но в zfs есть доработанный raid5 : raidz. Динамический размер старйпа, отсутствие частичных записей страйпов,пустые блоки не копируются(!!), ключсуммы вместо xor, защищает не просто от отказов диска, а обнаруживает отказы отдельных блоков на диске(что весьма полезно при когда диск начинает умирать, а smart говорит что всё норм).

Есть еще raidz2 и raidz3 которые выдерживают смерть 2 и 3 дисков, но их не юзал.

sky92
(14.01.20 02:29:03 MSK)
Последнее исправление: sky92 14.01.20 02:29:39 MSK (всего исправлений: 1)

Ответ на: комментарий от sky92 11.01.20 06:13:05 MSK

Это как? Снепшот не сделается пока не произойдет sync()

Sync гарантирует только, что из кэша на диск было сброшено, но не гарантирует, что файл был дописан до конца и закрыт. как пример - inotify write_close

Censo ★
(14.01.20 03:51:36 MSK)

Ответ на: комментарий от Censo 14.01.20 03:51:36 MSK

Блин, бесперебойник ставить надо… Что еще могу сказать

sky92
(14.01.20 05:54:20 MSK)

Ссылка

Ответ на: комментарий от sky92 14.01.20 02:29:03 MSK

Есть еще raidz2 и raidz3 которые выдерживают смерть 2 и 3 дисков, но их не юзал.

Я юзаю. Недавно на бэкапном сервере сдох диск и, пока внезапно долго ехал от поставщика, сдох второй, после доезда дисков сделал замену с ресильвером, 0 байт потеряно.

P.S. На что менять старые 2.5" 10krpm wd raptor'ы, блин? :( Чую, больше я их не найду, т.к. их давно перестали производить.

Deleted
(14.01.20 15:43:40 MSK)

А палец он показал?

gtk3 ★★★★
(14.01.20 16:29:33 MSK)

Ссылка

Вот казалось бы. Ничего вообще не произошло. ZFS как работал под Linux, так и работает как модуль ядра или как часть ядра.

В чем смысл этой дискуссии? В чем смысл этого выступления от Linus?

Что значит ZFS не будет в ядре? - Оно в ядре и оно работает.

BTRFS может быть включен куда угодно, но оно как было отстоем так им и осталось.

P.S. Linus вообще не боится, что все его слова будут воспринимать как пустое место?

lefsha ★
(14.01.20 17:32:36 MSK)
Последнее исправление: lefsha 14.01.20 17:34:18 MSK (всего исправлений: 1)

Ответ на: комментарий от Deleted 14.01.20 15:43:40 MSK

В доках говорится что привязки нет к железу и можно юзать разные диски. Единственое что может быть это скорость будет равна самому слабому диску, но это не точно, так как это не аппаратный рейд и зфс может ранжировать нагрузку по дискам.. Так что бери замену по похожим характеристикам

У меня raidz на 2 одинаковых сеагейтах и одном похожем по характеристикам, но другой модели. Просадок или других проблем по сравнеию с одинаковыми дисками обнаружено не было.

А вообще насчет умирания дисков : одинаковые модели, из одной партии в равных условиях и естественно равным ресурсам - думаю нормальная картина что они будут вылетать друг за другом через какое то время использования (особенно во время замены на новый диск - во время ресинка риск возрастает с нагрузкой на оставшиеся диски), так что возможно это даже к лучшему в плане живучисти, что диски будут разные. Ну эт типо как 3 одинаковые тачки будут ехать одновременно по шоссе, с равным уровнем акселерации, с одинаково заправленным баком - остановятся примерно в одном месте. Короче если диск умер - надо срочно бежать его менять

sky92
(14.01.20 17:54:56 MSK)
Последнее исправление: sky92 14.01.20 18:00:46 MSK (всего исправлений: 3)

Ответ на: комментарий от lefsha 14.01.20 17:32:36 MSK

Главное что зфс не через фьюз, этого достаточно.

sky92
(14.01.20 17:55:32 MSK)

Ответ на: комментарий от sky92 14.01.20 17:55:32 MSK

Какой бы бред Linus не нес, но поддержка в ядре абсолютная. ROOTFS на ZFS работает, GRUB это дело загружает. Я совершенно не вижу отличий от любой другой FS включенной в ядро по степени интеграции.

Но в плане надежности и удобства использования это день и ночь со всем остальным.

Это же смех и грех, но в ext4 нет поддержки lz4 сжатия. Данные так и хранят в прямом виде, даже если это одни 0-и.

lefsha ★
(14.01.20 18:41:34 MSK)
Последнее исправление: lefsha 14.01.20 18:47:17 MSK (всего исправлений: 1)

Ответ на: комментарий от lefsha 14.01.20 18:41:34 MSK

Да тут какие то криворукие говорили что у них всё развалилось и виновата ФС, а не их кривые руки. Причем я ни разу не видел инфы где говорится о массовых потерях данных с zfs из за каких то катострафических ошибках в коде. Еще утверждения сыпались о том что zfs не COW, а ROW, при том что снепшот это COW и все жертвы маркетинга, а он дартаньян.

sky92
(14.01.20 20:09:30 MSK)

Ответ на: комментарий от Deleted 14.01.20 15:43:40 MSK

На что менять старые 2.5" 10krpm wd raptor’ы, блин?

На какие-нибудь SSD? Потому как ваши рапторы от вендора как бы не подороже выйдут.

Nastishka ★★★★★
(14.01.20 22:16:24 MSK)

Ответ на: комментарий от Nastishka 14.01.20 22:16:24 MSK

На какие-нибудь SSD?

Ставить какой-нибудь SSDSC2KI010T801 на 3D TLC в сервер я как-то брезгую. А ближайший SSDSC2BB012T701 на MLC уже стоит 45тр и остатки (т.к. тоже уже сошли с производства, ибо S3520). Печалька, ну да ладно.

Deleted
(14.01.20 22:36:52 MSK)

Ссылка

Ответ на: комментарий от sky92 14.01.20 17:54:56 MSK

В доках говорится что привязки нет к железу и можно юзать разные диски. Единственое что может быть это скорость будет равна самому слабому диску, но это не точно, так как это не аппаратный рейд и зфс может ранжировать нагрузку по дискам.. Так что бери замену по похожим характеристикам.

Да я в курсе про отсутствие привязки к железу. Просто ближайшая актуальная и недорогая замена - это wd red 2.5". Но он 5400rpm и ровно в 2 раза медленнее wd raptor :)

Deleted
(14.01.20 22:38:29 MSK)

Ссылка

Ответ на: комментарий от sky92 14.01.20 20:09:30 MSK

Если на данные плевать, то можно любую FS на SSD ставить и backups не делать. Каждый сам себе злобный буратино.

Использование ZFS означает, что данные важны. Минимальная конфигурация в таком случае это mirror она же и оптимальная с точки зрения простоты обновления и замены дисков. Все остальное это практически лишний геморрой.

А вот идея использовать разнотипные диски желательно одного размера например SSD+HDD очень умна. Хотя где их найдешь одного размера… Дороговато это.

Но в таком случае чтение по скорости получается по SSD, а надежность данных по HDD.

Альтернативный и более дешевый вариант это L2ARC cache на NVME диске. You won’t ever look back!

lefsha ★
(14.01.20 23:11:35 MSK)
Последнее исправление: lefsha 14.01.20 23:12:14 MSK (всего исправлений: 1)

Ответ на: комментарий от mv 14.01.20 00:20:18 MSK

Собирай в raid-5/6, в нём сами данные равносильны контрольной сумме.

Но ведь нет же. Классический RAID (будь то 1, 5 или 6) работает только в том случае, когда из внешнего источника известно, какой из дисков повреждён.

intelfx ★★★★★
(14.01.20 23:25:14 MSK)

Ответ на: комментарий от intelfx 14.01.20 23:25:14 MSK

Лучше не стоит с ним спорить, можно заразиться криворукостью - устроишься в трехбуквеную контору и у тебя там бтрфс развалится после неилюзорных глюков(каких именно никто не знает, и ты про них тоже никогда не узнаешь)

sky92
(15.01.20 00:03:37 MSK)

Ссылка

Про то что перевод сделан «надмозгом» уже говорили?

ioway ☆
(15.01.20 10:08:58 MSK)

Ссылка

По-моему, ZFS это больше баззворд

ext4 + fat, все остальное не нужно

LinuxDebian ★★★★
(15.01.20 12:01:07 MSK)

Ответ на: комментарий от Deleted 14.01.20 15:43:40 MSK

Я юзаю. Недавно на бэкапном сервере

Таки решился переехать на линуксовый zfs и тоже на бекап сервере. Какой у тебя дистр/ядро и из какой репы/самому_собирать модуль и инструменты?

VKraft ★★★
(15.01.20 17:22:39 MSK)

Ответ на: комментарий от VKraft 15.01.20 17:22:39 MSK

Ubuntu и ppa:jonathonf/zfs (он опять его сделал публичным вроде, хотя закрывал, но я и к приватной репе доступ имею, т.к. баги репортил ему) для личных нужд.

Deleted
(15.01.20 17:28:17 MSK)
Последнее исправление: Deleted 15.01.20 17:30:25 MSK (всего исправлений: 1)

Ответ на: комментарий от Deleted 15.01.20 17:28:17 MSK

Я привык к CentOS и там ядро ванильное 3.10 в 7-м и 4.18 в 8-м. А в ubuntu при обновлении ядра модуль zfs автоматом пересобирается или надо следить за версией ядра?

VKraft ★★★
(15.01.20 17:41:36 MSK)

Ответ на: комментарий от deadplace 11.01.20 13:15:20 MSK

дыа, и чем же этот твой GEOM круче? пмсм те же яйца

mumpster ★★★★★
(15.01.20 17:43:17 MSK)

Ответ на: комментарий от anonymous 11.01.20 13:21:32 MSK

не нравится open source — уходи из профессии, если работаешь с серверами, например.

это мне что ли? ну как бы можно работать с серверами и не касаться при этом «opensource» вообще. венда там али ещё какой AIX.

mumpster ★★★★★
(15.01.20 17:45:52 MSK)

Ссылка

Ответ на: комментарий от lefsha 14.01.20 23:11:35 MSK

минимальная конфигурация ZFS в Солярис - это как раз не зеркало, а тупо 1 диск. видал я такие «чудесные» мин.конфиги :( и да - если данные действительно важны (то есть на это есть деньги) - проще купить СХД где все эти вопросы уже как-то решены. например, у EMC типовой подход к этой проблеме на CLARiiON/VNX был таков: основные данные - на НЖМД, а флеш - как fast cache. ну либо 2 или 3 уровневое хранение («tiering», FAST VP) когда часто используемые данные переползают с саты на сас и потом флеш и наоборот.

ну и идея использовать разнотипные диски в одном реплике данных - очень так себе. не, абстрактно она типа хорошая. но не учитывает реалий жизни (физику процессов). лично я экспериментировал с «W» в mdadm (надеюсь, знаете что это такое?) для дисков с разной скоростью работы, когда на чтение работал только 1 из зеркала, в принципе приход был.:-)

mumpster ★★★★★
(15.01.20 17:55:26 MSK)

Ссылка

Ответ на: комментарий от VKraft 15.01.20 17:41:36 MSK

Я привык к CentOS и там ядро ванильное 3.10 в 7-м и 4.18 в 8-м.

https://github.com/zfsonlinux/zfs/wiki/RHEL-and-CentOS

А в ubuntu при обновлении ядра модуль zfs автоматом пересобирается или надо следить за версией ядра?

В ubuntu вообще zfs (и kernelspace и userspace) встроена. Вышеуказанный ppa просто обновляет и userspace (zfsutil-linux и зависимые библиотеки) и kernelspace (пакет zfs-dkms) до актуальных версий.

Deleted
(15.01.20 18:07:02 MSK)

Ответ на: комментарий от Deleted 15.01.20 18:07:02 MSK

Спасибо. Пока жду когда закупят винтов )

VKraft ★★★
(15.01.20 19:17:13 MSK)

Ответ на: комментарий от intelfx 14.01.20 23:25:14 MSK

Но ведь нет же. Классический RAID (будь то 1, 5 или 6) работает только в том случае, когда из внешнего источника известно, какой из дисков повреждён.

Ну тут я лишку, пожалуй, дал: с сектором без интегрити бит рот в MD на ходу не определится, если сам диск его прошляпил, или вообще не проверяет, что у него там на блинах лежит. Но посыл был в том, что RAID восстановит данные, а не просто сругается на битую чексумму, если одно только интегрити есть.

mv ★★★★★
(15.01.20 20:31:52 MSK)

Ответ на: комментарий от VKraft 15.01.20 19:17:13 MSK

Собирай 8.2, там zpool можно initialize!!

sky92
(16.01.20 14:55:17 MSK)

Ответ на: комментарий от LinuxDebian 15.01.20 12:01:07 MSK

Тебе и aufs не нужно?

sky92
(17.01.20 14:31:39 MSK)

Ссылка

Ответ на: комментарий от mumpster 15.01.20 17:43:17 MSK

Тем, что он может трансформировать любые I/O запросы ядра в любые операции с дисками. Хочешь RAID0 — на, RAID1 — забирай, шифрование — пожалуйста, даже проброс диска по сети (хотя кому такое надо?) и то есть

~~deadplace~~ ★
(18.01.20 13:11:07 MSK)

Ответ на: комментарий от mv 15.01.20 20:31:52 MSK

Но посыл был в том, что RAID восстановит данные, а не просто сругается на битую чексумму, если одно только интегрити есть.

А в zfs RAID не восстановит по твоему?

// Уже не читал тред, мимопроходил

~~deadplace~~ ★
(18.01.20 17:20:05 MSK)

Ссылка

Ответ на: комментарий от deadplace 18.01.20 13:11:07 MSK

тут написана какая-то ересь. ибо по сути даже в венде начиная с 2000 (слава веритасу! vxvm слава!) такое есть.

mumpster ★★★★★
(20.01.20 04:35:34 MSK)

Ответ на: комментарий от sky92 16.01.20 14:55:17 MSK

я смотрю, везде пишут, что у ZFS идет просадка по производительности, если она заполнена больше 80%. т.е. предлагается держать 20%, а это дофига вообще-то. как можешь прокомментировать?

Solaris ZFS Best Practices Guide:

Keep pool space under 80% utilization to maintain pool performance. Currently, pool performance can degrade when a pool is very full and file systems are updated frequently, such as on a busy mail server. Full pools might cause a performance penalty, but no other issues. If the primary workload is immutable files (write once, never remove), then you can keep a pool in the 95-96% utilization range. Keep in mind that even with mostly static content in the 95-96% range, write, read, and resilvering performance might suffer.

~~crypt~~ ★★★★★
(22.01.20 18:44:58 MSK)
Последнее исправление: crypt 22.01.20 18:47:13 MSK (всего исправлений: 1)

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 →

← Релиз OpenWRT 19.07

Open Source

Релиз встраиваемой системы реального времени Embox v0.4.0 →

Похожие темы