Линус Торвальдс высказался о ZFS

4

5

В процессе обсуждения планировщиков ядра Linux пользователь Джонатан Данти пожаловался, что изменения в ядре сломали важный сторонний модуль — ZFS. Вот что написал в ответ Торвальдс:

Имейте в виду, что тезис «мы не ломаем пользователей» относится к программам пространства пользователя и к ядру, которое я сопровождаю. Если вы добавляете сторонний модуль вроде ZFS, то вы сами по себе. У меня нет возможности поддерживать такие модули, и я не отвечаю за их поддержку.

И, откровенно говоря, я не увижу ни одного шанса на включение ZFS в ядро, пока не получу официальное сообщение от Oracle, заверенное их главным юрисконсультом или, лучше всего, самим Ларри Эллисоном, в котором говорится, что всё ок, и ZFS теперь под GPL.

Некоторые думают, что добавить код ZFS к ядру — неплохая идея, и что интерфейс модуля нормально с этим справляется. Что ж, это их мнение. Я же не чувствую такое решение надёжным, учитывая спорную репутацию Oracle и проблемы, связанные с лицензированием.

Поэтому мне абсолютно неинтересны штуки вроде «слоёв совместимости ZFS», которые, как некоторые думают, изолируют Linux и ZFS друг от друга. Нам от этих слоёв никакой пользы, а учитывая склонность Oracle судиться из-за использования их интерфейсов — я не думаю, что это реально решает проблемы с лицензиями.

Не используйте ZFS. Вот и всё. По-моему, ZFS это больше баззворд, чем что-то ещё. Проблемы с лицензированием — только ещё одна причина, почему я никогда не стану заниматься этой ФС.

Все бенчмарки производительности ZFS, что я видел, совершенно не впечатляют. И, как я понимаю, ZFS уже даже толком не сопровождается, и никакой долгосрочной стабильностью здесь не пахнет. Зачем вообще её использовать?

>>> Подробности

Ссылка

← Релиз OpenWRT 19.07

Релиз встраиваемой системы реального времени Embox v0.4.0 →

← 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 →

Ответ на: комментарий от mv 11.01.20 10:50:45 MSK

В миллионы!

Пожалуй соглашусь, вполне реальная оценка для некоторых случаев с огромным количеством мелких файлов.

Кластеры-шмастеры… Видишь, ты уже внутренне согласился, что ZFS для надёжности нужен какой-то HA.

Так это нужно для любой системы, не только файловой.

В облаке, в самом низу, есть такое понятие, как минимальный blast radius. Идеально, когда всё работает в пределах одного гипервизора и ни от чего не зависит, чтобы когда он упадёт, то вокруг ничего другого не сломалось.

Пожалуйста, попо дробнее. Когда упадет гипервизор без HA, то виртуалки внутри него сломаться не должны?

~~a_buchinskiy~~
(11.01.20 10:53:54 MSK)

Ссылка

Ответ на: комментарий от burato 11.01.20 10:52:54 MSK

Еще бы, крипту нужно хранить в подкроватном банке.

~~a_buchinskiy~~
(11.01.20 10:55:06 MSK)

Ответ на: комментарий от a_buchinskiy 11.01.20 10:55:06 MSK

подкроватной банке

~~burato~~ ★★★★★
(11.01.20 10:55:56 MSK)

Ответ на: комментарий от a_buchinskiy 11.01.20 10:42:19 MSK

Я уже объяснял, что при EMI атаке ни контроллер ни диск не в состоянии полностью уследить за целостностью, даже промышленный SAS. ZFS может (точно проверенно).

Прими уж таблеток и почитай про SerDes, Соломон-Рида и прочие основы защиты данных. Нарушение целостности в железе системах хранения данных происходит примерно постоянно.

mv ★★★★★
(11.01.20 10:56:31 MSK)

Ответ на: комментарий от burato 11.01.20 10:55:56 MSK

Ну как бы это и подразумевалось под спектрумом в отличии от IntelME в глубоком бункере :)

~~a_buchinskiy~~
(11.01.20 10:57:14 MSK)

Ссылка

Ответ на: комментарий от mv 11.01.20 10:56:31 MSK

Лучше объясни в кратце, что ты имел ввиду.

Я тебе пишу о том, что наблюдал в своей практике.

Зачем мне твой Соломон, если ZFS рапортует, что он облажался?

~~a_buchinskiy~~
(11.01.20 10:59:02 MSK)

баззворд

Как это понимать?

splinter ★★★★★
(11.01.20 11:06:59 MSK)

Ответ на: комментарий от splinter 11.01.20 11:06:59 MSK

Что-то вроде «вау-словечка». Типа: «ну ты и лошара, у тебя смартфон прошлого поколения, а у меня последний Сяоми с нейросетями!». «Нейросети» в данном случае - баззворд.

Deleted
(11.01.20 11:14:24 MSK)

Ссылка

Ответ на: комментарий от splinter 11.01.20 11:06:59 MSK

https://ru.wikipedia.org/wiki/%D0%9C%D0%BE%D0%B4%D0%BD%D1%8B%D0%B5_%D1%81%D0%BB%D0%BE%D0%B2%D0%B0

anonymous
(11.01.20 11:16:40 MSK)

Ссылка

Ответ на: комментарий от a_buchinskiy 11.01.20 10:59:02 MSK

Пока

ZFS рапортует, что он облажался

нормальные системы хранения просто исправляют ошибки.

Вопрос. Вот тебе zfs раопротовал, что облажался, и что ты сделаешь? Выйдешь в окно?

Чексуммы на уровне файловой системы - это паранойя, не имеющая под собой никакого основания.

anonymous
(11.01.20 11:25:29 MSK)

Ответ на: комментарий от anonymous 11.01.20 11:25:29 MSK

Чексуммы на уровне файловой системы - это паранойя, не имеющая под собой никакого основания.

Слова дурачка любителя NTFS!

нормальные системы хранения просто исправляют ошибки.

Как и ZFS

~~deadplace~~ ★
(11.01.20 11:32:23 MSK)

Ответ на: комментарий от anonymous 11.01.20 11:25:29 MSK

Все, что мешает вредить ганстолкерским бандитам - шиз и паранойя.

~~a_buchinskiy~~
(11.01.20 11:33:32 MSK)

Ссылка

Ответ на: комментарий от deadplace 11.01.20 11:32:23 MSK

Чексуммы на уровне файловой системы - это паранойя, не имеющая под собой никакого основания.

Слова не дурачка, а троля :)

~~a_buchinskiy~~
(11.01.20 11:34:57 MSK)

Ссылка

Ответ на: комментарий от a_buchinskiy 11.01.20 10:40:44 MSK

Твоей компании угрожают Джеймс Бонд и Леонид Поттеринг.

Забавная у тебя модель угроз.

Ostegard ★
(11.01.20 11:36:32 MSK)

Ответ на: комментарий от deadplace 11.01.20 11:32:23 MSK

нормальные системы хранения просто исправляют ошибки.

Как и ZFS

И как он это делает? Чексуммы не могут корректировать ошибки. Для коррекции ошибок применют что-то другое, например, коды коррекции ошибок Рида-Соломона.

Слова дурачка любителя NTFS!

Слова безмозглого фанатика, умеющего только в громкие базворды.

anonymous
(11.01.20 11:38:54 MSK)

Ответ на: комментарий от anonymous 11.01.20 11:25:29 MSK

Вопрос. Вот тебе zfs раопротовал, что облажался, и что ты сделаешь?

Предприму меры: укорочу кабели диска, сделаю клон последнего целостного снэпшота, попытаюсь сделать на него rsync –checksum последнего состояния из текущей FS, почти всегда проходит удачно. Проверю какие файлы изменились с момента последнего целостного снэпшота, если какие-то важные типа Outlook или базы данных, то прогоню проверку целостности внутри приложения.

Кому-то достаточно и вовсе rollback

Выйдешь в окно?

Выйдет в окно тот, данные кого не были защищены ZFS. Он будет гадать какие его файлы изгажены всю оставшуюся до окна жизнь.

~~a_buchinskiy~~
(11.01.20 11:42:09 MSK)

Ответ на: комментарий от anonymous 11.01.20 11:38:54 MSK

И как он это делает? Чексуммы не могут корректировать ошибки. Для коррекции ошибок применют что-то другое, например, коды коррекции ошибок Рида-Соломона.

В ZFS возможно дублирование дисков даже 3x и наверно больше.

Кроме того даже на одном диске можно указать количество хранимых копий одинаковых блоков больше одной.

~~a_buchinskiy~~
(11.01.20 11:43:47 MSK)

Ответ на: комментарий от a_buchinskiy 11.01.20 11:43:47 MSK

Метаданные ZFS дублируются по умолчанию, поэтому бывает забавно наблюдать как ошибки исправляются ZFS даже на одном диске с одной копией.

~~a_buchinskiy~~
(11.01.20 11:44:46 MSK)

Ссылка

Ответ на: комментарий от Ostegard 11.01.20 11:36:32 MSK

Забавнее некуда.

Самый главный забияка - это Dimez и его спонсоры.

~~a_buchinskiy~~
(11.01.20 11:45:47 MSK)

Ответ на: комментарий от e7z0x1 10.01.20 11:48:16 MSK

Про оффлайновую я знаю, но это не сильно подходит для ситуации если сервер перегружается достаточно редко.

Оффлайн, это не означает, что нужно отмонтировать.

aidaho ★★★★★
(11.01.20 11:47:05 MSK)

Ссылка

Ответ на: комментарий от anonymous 10.01.20 12:11:24 MSK

есть резервные копии (локальные тоже на Btrfs)

Если это снапшоты, то нещитово.

aidaho ★★★★★
(11.01.20 11:47:42 MSK)

Ответ на: комментарий от a_buchinskiy 11.01.20 11:42:09 MSK

Предприму меры: укорочу кабели диска…

Слова админа подкроватного сервера, и то неудавшегося.

Выйдет в окно тот, данные кого не были защищены ZFS.

И как защитил zfs твои данные? Бекап в другой системе - это не заслуга облажавшегося zfs. Ах да, с таким же успехом твой бекап может оказаться в другой облажавшейся zfs.

anonymous
(11.01.20 11:55:14 MSK)

Ссылка

Ответ на: комментарий от aidaho 11.01.20 11:47:42 MSK

Если это снапшоты, то нещитово.

Если быть точным, то отправленный на другой компьютер снапшот имеет право называться бэкапом. Но у меня обычные резервные копии, borg и rsync.

anonymous
(11.01.20 12:06:13 MSK)

Ответ на: комментарий от anonymous 11.01.20 11:38:54 MSK

И как он это делает? Чексуммы не могут корректировать ошибки. Для коррекции ошибок применют что-то другое, например, коды коррекции ошибок Рида-Соломона.

Из RAID или копий

~~deadplace~~ ★
(11.01.20 12:08:00 MSK)

Ссылка

Ответ на: комментарий от anonymous 11.01.20 12:06:13 MSK

Тогда кластеры это сплошные бекапы по такой логике. Вообще то это для работы пачки компов вместе с ZFS. Пока кто-то долбит один комп остальные успевают его восстанавливать из контрольных сумм.

anonymous
(11.01.20 12:09:09 MSK)

Ответ на: комментарий от anonymous 11.01.20 12:09:09 MSK

Ты либо не туда ответил, либо не в курсе, как работает send/receive.

anonymous
(11.01.20 12:10:40 MSK)

Ответ на: комментарий от a_buchinskiy 11.01.20 11:43:47 MSK

В ZFS возможно дублирование дисков даже 3x и наверно больше.

Дублирование с чексуммами не дает никакой предсказуемой гарантии и даже может существенно испортить данные при коллизии чексуммы.

В то время, например, коды Рида-Соломона гарантируют, какие ошибки могут определить и какие - исправить.

anonymous
(11.01.20 12:11:46 MSK)

Ответ на: комментарий от anonymous 11.01.20 12:10:40 MSK

Данные посылаются и без явного участия человека в создании снапшота. Именно отсутствие необходимости гнать все данные и внесение лишь изменений адаптирует ZFS для кластеров. Даже Plan9 умеет работать с сетью что не делает удаленный жесткий диск снапшотом.

anonymous
(11.01.20 12:12:40 MSK)

Ответ на: комментарий от anonymous 11.01.20 12:12:40 MSK

ЯННП, что ты несёшь, но это не имеет отношения к сетям и кластерам, ты просто не в курсе, что такое send/receive. Их можно делать хоть в локальный файл / из файла.

anonymous
(11.01.20 12:14:45 MSK)

Ответ на: комментарий от anonymous 11.01.20 12:14:45 MSK

Что не доказывает, что я не прав. Посылать можно хоть в виртуалку. Что такое слать/получать понимают не только якобы крутые админы с бородой.

anonymous
(11.01.20 12:17:35 MSK)

Ответ на: комментарий от anonymous 11.01.20 12:11:46 MSK

Дублирование с чексуммами не дает никакой предсказуемой гарантии и даже может существенно испортить данные при коллизии чексуммы.

Если выбрать сложный хэш для чексумм (не CRC32), то представь какая вероятность сбоя? 1 раз в миллиард лет?

Ну предположим произошла коллизия, пострадал один бэкап и внезапно именно нужный нам! (невероятно? но допустим).

Потеряли ли мы данные? Конечно нет, а почему? А потому что мы еще храним и архивные логи базы данных на другом ZFS хранилище без дедупликации.

Так, и что же мы делаем при невероятном сбое?

Восстановимся из более раннего бэкапа, и накатим на него архивных логов не за полдня, а за полтора. Дольше? - конечно, но данных мы не потеряли. А экономия от дедупликации бэкапов DB2 огромна!

~~a_buchinskiy~~
(11.01.20 12:19:06 MSK)

Ответ на: комментарий от anonymous 11.01.20 12:17:35 MSK

Что не доказывает, что я не прав.

Просто твои заявления нерелевантны, безотносительно их корректности.

anonymous
(11.01.20 12:19:12 MSK)

Ответ на: комментарий от a_buchinskiy 11.01.20 12:19:06 MSK

Причем экономия не раз в миллиард лет, а ежедневная на объем базы данных. Записывается дедуплицированный бэкап ессно тоже быстрее, потому что он почти не пишет :)

Но нагрузка при бэкапе восновном, как нетрудно догадаться, не на запись бэкапа, а на вычитывание сильно рандомно фрагментированного источника базы.

~~a_buchinskiy~~
(11.01.20 12:21:45 MSK)

Ответ на: комментарий от kott 11.01.20 05:22:43 MSK

Это было логичное, пусть и ошибочное, предположение. ☺

mord0d ★★★★★
(11.01.20 12:21:55 MSK)

Ссылка

Ответ на: комментарий от a_buchinskiy 11.01.20 12:19:06 MSK

А как же мы определим наличие коллизии? Ах да, DB2 ведь тоже хранит свои собственные чексуммы, вот так-то.

~~a_buchinskiy~~
(11.01.20 12:23:06 MSK)

Ссылка

Ответ на: комментарий от RedEyedMan666 11.01.20 01:40:38 MSK

Изучи механизм SoftUpdates, чтобы такие вопросы были исчерпаны.

iZEN ★★★★★
(11.01.20 12:26:17 MSK)

Ответ на: комментарий от a_buchinskiy 11.01.20 12:19:06 MSK

Если выбрать сложный хэш для чексумм (не CRC32), то представь какая вероятность сбоя? 1 раз в миллиард лет?

Слова академика выдуманной академии паранормальных наук.

Прежде чем считать вероятности надо либо собрать статистику (которой у тебя нет, так как у тебя даже рабочего подкроватного сервера нет), либо теоретически вывести (этой теории у тебя тоже нет, потому что ты даже не выдуманный академик).

anonymous
(11.01.20 12:29:26 MSK)

что опять? а так нахваливали...

amd_amd ★★★★★
(11.01.20 12:31:49 MSK)

Ссылка

Ответ на: комментарий от anonymous 11.01.20 12:29:26 MSK

Увеличиваем длину хэша по максимуму.

~~a_buchinskiy~~
(11.01.20 12:32:05 MSK)

Ответ на: комментарий от a_buchinskiy 11.01.20 10:42:19 MSK

точно проверенно

кто-то верит такому уровню граммотности (sic!) ?

anonymous
(11.01.20 12:36:06 MSK)

Ответ на: комментарий от anonymous 11.01.20 12:36:06 MSK

Ну я лично наблюдал, как 22 июня 2015 года на сервере Kraftway относительно дорогой на момент его покупки RAID контроллер Adaptec SAS не видел никаких проблем со своими дисками, а ZFS заметила CRC ошибки на одном из vdev одного из zmirror.

Я заменил диск, после resilvering стало все хорошо.

Потери данных не было, несмотря на то, что контроллер облажался, диски были отдельным массивами с точки зрения Adaptec.

~~a_buchinskiy~~
(11.01.20 12:41:01 MSK)

Ответ на: комментарий от a_buchinskiy 11.01.20 12:32:05 MSK

Увеличиваем длину хэша по максимуму.

Что дает увеличение ~~члена~~ хеша?

Чисто теоретический эксперимент.

Мне надо хранить в zfs данные, которые имеют одинаковую чексумму, занимаюсь поиском коллизий, так сказать. Какова вероятность того, что из-за облажавшейся zfs я потеряю данные, которые миллиарды лет считал за миллирад шекелей в день?

anonymous
(11.01.20 12:41:08 MSK)

Ответ на: комментарий от a_buchinskiy 11.01.20 12:41:01 MSK

Причем до этого ZFS отработал на этом сервере полтора года без каких либо замечаний в zpool status.

~~a_buchinskiy~~
(11.01.20 12:42:02 MSK)

Ссылка

Ответ на: комментарий от intelfx 10.01.20 18:07:31 MSK

В смысле не умение? По дефолту динамический.

anonymous
(11.01.20 12:43:28 MSK)

Ссылка

Ответ на: комментарий от anonymous 11.01.20 12:41:08 MSK

которые миллиарды лет считал за миллирад шекелей в день?

Ну если ты такой богатый писатель фантаст, то наверно, найдешь пару копеечек деньжат (на фоне твоей вселенской задачи) закинуть их в проект ZFS on Linux, чтобы персонально для тебя туда впилили новые алгоритмы супердлинных хешей на фоне которых вероятность коллизии за миллиард лет померкнет и тебе придется работать уже на периодах миллиард в сотой степени лет?

~~a_buchinskiy~~
(11.01.20 12:45:55 MSK)

Ссылка

Ответ на: комментарий от Zidane 10.01.20 21:14:23 MSK

ага, а я думал все сказочники уже в сборе

anonymous
(11.01.20 12:50:28 MSK)

Ответ на: комментарий от anonymous 11.01.20 12:11:46 MSK

При коллизии чексуммы между живой копией и случайно испорченной? Не смеши.

intelfx ★★★★★
(11.01.20 12:52:12 MSK)

Ссылка

Ответ на: комментарий от anonymous 11.01.20 12:41:08 MSK

Мне надо хранить в zfs данные, которые имеют одинаковую чексумму, занимаюсь поиском коллизий, так сказать. Какова вероятность того, что из-за облажавшейся zfs я потеряю данные

Нулевая. ZFS не content-addressable, коллизии там у тебя или нет — это вообще не важно. Хеши там используются для того, чтобы отличить живую копию блока от испорченной, а не для того, чтобы отличить один файл от другого.

intelfx ★★★★★
(11.01.20 12:53:52 MSK)

Ответ на: комментарий от anonymous 11.01.20 12:19:12 MSK

Просто твои заявления нерелевантны, безотносительно их корректности.

По-русски не способен уже? Ты о чем там вообще?

Цитируем википедию

(англ. relevance — актуальность, уместность)

Релева́нтность в информационном поиске — семантическое соответствие поискового запроса полученному документу.

Существует несколько подходов к оценке релевантности. Содержательная релевантность — соответствие ответов информационному запросу, определяемое неформальным путём. Формальная релевантность — соответствие, определяемое путём сравнения образа поискового запроса с поисковым образом ответа по определённому алгоритму.

Цели и средства должны соответствовать и никто в здравом уме не будет форсировать установку ZFS или жестких дисков в одноплатные компьютеры с 256 мегабайтами оперативной памяти. Область применения данной файловой системы не ограничена одним компьютером. А ее инструменты позволяют организовать бесперебойную работу без вмешательства непосредственно в организацию копирования данных куда-либо. Вот представь себе поток данных какой-нибудь сотовой компании. Количество различных атак и количество администраторов готовых эти проблемы решать круглосуточно. Они контейнерами закупали всякие сервера. А ты тут про релевантность учудил. Где же все эти якобы супер профи руками решающие каждую проблему? Тут понтов у каждого с гору. Только они не могут внятно ничего доказать. Потому что не по месту обсуждают применение файловой системы локально. Всю эту чушь оставь девочкам ничего не понимающим в информационных технологиях.

anonymous
(11.01.20 12:54:01 MSK)

Ответ на: комментарий от anonymous 11.01.20 12:54:01 MSK

ZFS

Да ты задрал со своей ZFS.

По-русски не способен уже?

Задай этот вопрос себе, а потом найди, где я говорил о ZFS.

anonymous
(11.01.20 12:55:44 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 →

← Релиз OpenWRT 19.07

Open Source

Релиз встраиваемой системы реального времени Embox v0.4.0 →

Похожие темы