DAXFS — новейшая высокоскоростная ФС

0

3

DAXFS — это простая файловая система только для чтения, которая работает непосредственно с общей физической памятью через подсистему DAX (Direct Access). Она полностью обходит традиционный стек блочного ввода-вывода, чтение файлов осуществляется путем прямой загрузки в память без кэша страниц и копирования.

Особенности:

чтение файлов происходит как прямая загрузка из памяти, без дублирования в кэше;
поддержка памяти GPU, FPGA и CXL-устройств через DMA;
DAXFS изначально был разработан для многоядерных сред, где несколько экземпляров ядра совместно используют одну область физической памяти;
использует формат образа только для чтения, не требующий выделения памяти во время выполнения и сложного управления устройствами.

Предложение отправлено в Linux Kernel Mailing List. Код уже доступен на GitHub, но для включения в основное ядро Linux потребуются обсуждения и доработки.

>>> Phoronix

Ссылка

← GNU Guix 1.5.0

Игра Banjo-Kazooie теперь нативно доступна на ПК →

← 1 2 →

Ответ на: комментарий от monk 25.01.26 19:35:16 MSK

да, это последствия ущербного подхода недо-вм, хотя они даже до уровня openvz не дотягивают. ИЧСХ, у него как раз такой проблемы не было.

mumpster ★★★★★
(25.01.26 20:08:28 MSK)

Ответ на: комментарий от windows10 25.01.26 19:58:30 MSK

Если данные размещаются в памяти, более того размещаются определенной программой в определенных условиях, без r\w - какой смысл дергать для их чтения блочные функции, если можно обращаться напрямую по указателю?

Например, потому что уже есть программа, распространяемая в виде образа докера, которую надо запускать во множестве экземпляров. И выбор как всегда: костыль или велосипед. Костыль мы обсуждаем сейчас, а велосипед = собственная программа, делающая то же самое, но использующая разделяемую память для данных вместо файлов.

monk ★★★★★
(25.01.26 20:10:38 MSK)

Ссылка

Ответ на: комментарий от Obezyan 25.01.26 18:59:28 MSK

Ну, может быть, да

gns ★★★★★
(25.01.26 20:37:29 MSK)

Ссылка

Ответ на: комментарий от DrRulez 25.01.26 18:26:32 MSK

Ну может быть. Надо проверять. Как-то это все вымученно выглядит.

gns ★★★★★
(25.01.26 20:38:37 MSK)

Ссылка

Ответ на: комментарий от mumpster 25.01.26 17:57:06 MSK

Исошник, не исошник... Во тут коллеги накидали пару кейсов, может чего и получится. Но применительно к контейнерам (читай — исошникам) тут толку мало. Вот применительно к read-only кешам или к большим словарям для параллельных вычислений может выйгрыш какой и будет.

gns ★★★★★
(25.01.26 20:43:04 MSK)

Ссылка

Дайте грант, и я создам write-only filesystem, по скорости опережающую вообще всех.

unsigned ★★★★
(25.01.26 21:09:44 MSK)

Ответ на: комментарий от unsigned 25.01.26 21:09:44 MSK

Дайте грант, и я создам write-only filesystem, по скорости опережающую вообще всех.

> /dev/null уже изобрели, вы опоздали.

~~Obezyan~~ ☆
(25.01.26 22:25:24 MSK)

Ответ на: комментарий от Obezyan 25.01.26 22:25:24 MSK

Только это не filesystem. Нельзя сделать mount /dev/null /mnt && mkdir /mnt/test && head -10 /dev/random /mnt/test/preciousrandombytes.bin

CrX ★★★★★
(25.01.26 22:27:55 MSK)

Ответ на: комментарий от CrX 25.01.26 22:27:55 MSK

Только это не filesystem.

Но это часть файловой системы.

~~Obezyan~~ ☆
(25.01.26 22:30:04 MSK)

Ответ на: комментарий от Obezyan 25.01.26 22:30:04 MSK

Несомненно.

Вообще именно ФС такую на FUSE тоже сделать очень легко (наверняка даже есть уже, но я не проверял).

CrX ★★★★★
(25.01.26 22:42:01 MSK)

Ответ на: комментарий от unsigned 25.01.26 21:09:44 MSK

/dev/null ?

gns ★★★★★
(25.01.26 23:39:04 MSK)

Ответ на: комментарий от windows10 25.01.26 19:58:30 MSK

Блочные функции как ни странно тоже для своей работы требуют стек

Только не удивляйся, но всё что работает через ядро требует стек. А любая файловая система в общем то внезапно тоже работает через ядро. Не, ну конечно можно придумать какое-нибудь приседание вокруг всяких там новомодных механизмов типа spdk и тому подобных, но там лекарство как бы не хуже болезни.

Получается если у меня есть 16 гиговый файл в ОЗУ, и мне нужно его с’fread’ить - то мне будут нужны еще 16 гиг ОЗУ, ну либо же костыли с поблочным чтением.

Функция fread построена так, что читает в юзерспейсный буфер. Поэтому все программы которым используют эту функцию требют «еще 16 гиг» как ты написал. А вот чтобы ходить в ту же память в которой лежит файл - всё, внезапно, уже придумано - и зовется… Эмм, как оно звалось?! Точно - зовется mmap. У тебя файл на tmpfs, ты делаешь mmap и потом можешь с этим файлом работать как будто он уже загружен в память. Нафига для этого придумывать новую ФС?

По факту это такая упрощенная (но не факт, ибо например всякие xattr, сим и хард линки и прочее никто не отменял) iso9660 поверх ramdisk, только «всё в одном»

no-dashi-v2 ★★★★
(26.01.26 02:06:45 MSK)

Ссылка

Ответ на: комментарий от gns 25.01.26 23:39:04 MSK

Файл любой дурак разработает! У меня - целая ФС.

unsigned ★★★★
(26.01.26 02:35:38 MSK)

Ответ на: комментарий от unsigned 26.01.26 02:35:38 MSK

выкатывай релиз, годная тема)

piyavking ★★★★★
(26.01.26 03:35:41 MSK)

Ссылка

Ответ на: комментарий от MKuznetsov 25.01.26 15:04:34 MSK

Насколько я понимаю, обход страничного кэша позволяет экономить память на системах с несколькими ядрами. А вы видели сколько память нынче стоит?

cobold ★★★★★
(26.01.26 08:46:57 MSK)

Ответ на: комментарий от cobold 26.01.26 08:46:57 MSK

обход страничного кэша позволяет экономить память на системах с несколькими ядрами

смутные воспоминания о том как оно там всё устроено, говорят что память будет экономиться только если ядрам понадобился один и тот-же не слишком большой файл.

Большой файл налитый в память для обхода кешей ничего не экономит а как раз наоборот. (зато его «хакать» просто, нашёл адрес и раздал зловреда на все ядра без лишних следов)

Единственный разумный вариант, это если файл УЖЕ в памяти by-design и read-only он тоже аппаратно.. ROM, GPU, модные NN-ускорители, может ещё что-то подобное. Только зачем там целая файловая система

MKuznetsov ★★★★★
(26.01.26 10:53:59 MSK)

Ссылка

Ответ на: комментарий от gns 25.01.26 17:01:44 MSK

Масштабирование в K8S, через HPA. Особенно актуально для приложений, которые толком не умеют в многопоточность, но не только для них.

AlexM ★★★★★
(26.01.26 11:25:12 MSK)

Ссылка

Ответ на: комментарий от mumpster 25.01.26 20:08:28 MSK

В vz изрядное приседалово вприсядку было для того, чтобы расшарить между паравиртуалками общие файлы. На хостовой ноде распаковывались особым образом приготовленные пакеты, файлы которых потом пробрасывались в ВМ с COW-семантикой. Деталей, конечно, уже не помню, всё ж таки двадцать лет прошло, но Интересных Технических Решений было порядком.

AlexM ★★★★★
(26.01.26 11:36:49 MSK)

Ссылка

Ответ на: комментарий от CrX 25.01.26 12:29:56 MSK

Для обычного пользователя не нужно.

AbbaT ★★
(26.01.26 14:00:41 MSK)

Ответ на: комментарий от AbbaT 26.01.26 14:00:41 MSK

Годится. Я не против, если ты будешь за мной ходить и в каждой теме пояснять сказанное так, чтобы даже совсем дебил понял.

CrX ★★★★★
(26.01.26 14:02:44 MSK)

Ответ на: комментарий от CrX 26.01.26 14:02:44 MSK

Твоего разрешения никто и не спрашивал, успокойся, бггг.

AbbaT ★★
(26.01.26 14:06:00 MSK)

Ссылка

Ответ на: комментарий от imul 25.01.26 12:43:55 MSK

Чтобы оттуда что-то прочитать туда надо что-то записать, а фс только для чтения

Чтобы продать что-нибудь нинужное нужно купить что-нибудь ненужное, а у нас денег нет :)

pihter ★★★★★
(26.01.26 14:13:47 MSK)

Ссылка

Ответ на: комментарий от CrX 25.01.26 22:42:01 MSK

Вот вы смеётесь, а совсем недавно это даже обсуждалось на полном серьёзе:

настройка «черной дыры» для папки

unDEFER ★★★★★
(26.01.26 14:35:55 MSK)

Ссылка

ну теперь точно 2026 год десктопа на линуксе. с такой-то файловой системой.

Biene
(28.01.26 00:35:36 MSK)

Ссылка

Ответ на: комментарий от gns 25.01.26 16:57:47 MSK

ээээ!

если книга редкий текст но не инкабула(?!) что бы её было не адекватно расброшюрорывать

то легко одна книжка(выж кодекс подразумеваете ибо свиток в лёгкую хоть весь легион разом) с белыми полями может быть прочитана пятёркой чернорабочих в разные главы-страницы

qulinxao3 ★☆
(28.01.26 06:17:46 MSK)

Ответ на: комментарий от windows10 25.01.26 19:58:30 MSK

речь скорее про хранилище персистентных объектов - т.е если и есть указатели то они базированы не по mmu а от некоторой области адресного пространства

т.е. в этом смысле ФС как агрегата/контейнера содержащие независимо по отношению друг другу сущности ака файлы

ваще ФС это инструмент персистентности с некоторой конкретизацией структуры хранения

qulinxao3 ★☆
(28.01.26 06:36:26 MSK)

Ссылка

Ответ на: комментарий от qulinxao3 28.01.26 06:17:46 MSK

Это чот сложно! Хорошо переплетенный кодекс еще пойди разброшюруй. Да и убить могут за порчу книг. :)

gns ★★★★★
(28.01.26 10:34:59 MSK)

Ссылка

Ответ на: комментарий от gns 25.01.26 16:57:47 MSK

Ксерокопируют и вполне читают.

seiken ★★★★★
(28.01.26 16:40:49 MSK)

Ответ на: комментарий от seiken 28.01.26 16:40:49 MSK

Э... Тут не так. Процесс ксерокопирования — это процесс чтения книги ксероксом с побочными эффектами. Все равно книга монопольно используется в этот момент. Тут больше канает пример из «Приключений Шурика» про то, как он к экзамену в интституте готовился, читая книжку через девушкино плечо. Но это случай уникальный.

gns ★★★★★
(28.01.26 17:56:49 MSK)