Логика размещения файлов в ФС

0

4

По какой логике заполняются файлами линуксовые ФС вроде ext4 и xfs — по порядку, от начала раздела к концу, или данные могут писаться куда угодно, хоть в начало, хоть в конец, хоть в середину?

Вроде Btrfs заполняется данными непоследовательно, а у более традиционных ФС с этим как?

Ссылка

←	Проблема с mint 19

Проблема с входом в Kali Linux

→

← 1 2 →

Ответ на: комментарий от anonymous 06.10.19 17:26:52 MSK

ну так и спроси его как анон анона!

amd_amd ★★★★★
(06.10.19 17:28:47 MSK)

Ссылка

Ответ на: комментарий от gag 06.10.19 17:22:19 MSK

неужто такой прымитив.

помнится под винду был уникально умный дефрагментатор, который файлики мог весьма сильно раскидать по разделу. к примеру музон видосики торренты и прочую редко используемую бадягу можно было засунуть в конец диска.

но в линуксе фрагментации не существует :)

pfg ★★★★★
(06.10.19 18:24:01 MSK)
Последнее исправление: pfg 06.10.19 18:27:51 MSK (всего исправлений: 2)

Ответ на: комментарий от pfg 06.10.19 18:24:01 MSK

но в линуксе фрагментации не существует :)

Не хорош ли по одним и тем же граблям то гулять? Логика размещения файлов в ФС (комментарий)

anonymous
(06.10.19 18:46:29 MSK)

Ответ на: комментарий от amd_amd 06.10.19 17:14:28 MSK

он только хуже делает

Не то. Не хуже делает, но и «лучше» (а точнее «менее плохо») это тоже не назовёшь.

anonymous
(06.10.19 19:10:35 MSK)

Ссылка

Ответ на: комментарий от anonymous 06.10.19 18:46:29 MSK

фрагментация данныех не меньшая проблема чем фрагментация индекса к ним.
спробуй хранить данные в бд с «правильным» индексом.

pfg ★★★★★
(06.10.19 20:46:32 MSK)

Ответ на: комментарий от pfg 06.10.19 20:46:32 MSK

не меньшая проблема

Именно меньшая и намного меньшая!

anonymous
(06.10.19 20:49:44 MSK)

Ответ на: комментарий от anonymous 06.10.19 20:49:44 MSK

Херня. Иноды закешировать проще чем данные, тк они меньше весят.

anonymous
(06.10.19 21:13:21 MSK)

Ответ на: комментарий от anonymous 06.10.19 21:13:21 MSK

Иноды закешировать проще чем данные

Только их сначала «прочитать» надо. Логика размещения файлов в ФС (комментарий)

anonymous
(06.10.19 21:15:52 MSK)

Ответ на: комментарий от anonymous 06.10.19 21:15:52 MSK

обратная ситуация: один файл, но напиленный фрагментами по самое небалуйся. инод один но длинный и сильно нафаршированный.

pfg ★★★★★
(06.10.19 22:38:14 MSK)

Ответ на: комментарий от pfg 06.10.19 22:38:14 MSK

инод один но длинный и сильно нафаршированный.

Сам прочитал написанное? А я о чём собстна говорю? Алё?

anonymous
(06.10.19 22:40:58 MSK)

Ссылка

Ответ на: комментарий от pfg 06.10.19 17:18:44 MSK

а подвох стандартен - если во время дефрагментации будут зависания али что еще, то файловую систему может скушать известный северный зверек. ибо действия не журналированы.

Пруфец будет?

aidaho ★★★★★
(07.10.19 08:59:24 MSK)

Ссылка

Ответ на: комментарий от Deleted 06.10.19 13:04:44 MSK

Не вникал в методику размещения, не нужно было. За подробностями придётся лазить в код.

i-rinat ★★★★★
(07.10.19 19:01:28 MSK)

Ответ на: комментарий от i-rinat 07.10.19 19:01:28 MSK

Мы тут с помощью твоей тулзы уже всё выяснили)

Deleted
(07.10.19 19:02:15 MSK)

Ответ на: комментарий от Deleted 06.10.19 13:24:39 MSK

Что за диагональные просветы в 1-2 клетки?

Ext4 делит всё дисковое пространство на группы блоков. В каждой группе в начале находятся таблицы inode. В ext4 число инодов фиксировано и задаётся во время форматирования. Вот там в начале групп эти таблицы и лежат. Это место нельзя отобрать у инодов и использовать под хранение данных, поэтому оно всегда будет просветами на карте. На карте показываются только блоки, занятые файлами и директориями.

i-rinat ★★★★★
(07.10.19 19:09:56 MSK)

Ссылка

Ответ на: комментарий от pfg 06.10.19 22:38:14 MSK

инод один но длинный и сильно нафаршированный.

Inode это структура фиксированного размера. Её нельзя поменять в процессе работы штатными способами. В ней есть 60 байт места, где либо хранится список блоков, составляющих файл, либо перечисляются диапазоны блоков (extents), где лежит файл. Если файл маленький, он может прямо в этих 60 байтах храниться.

i-rinat ★★★★★
(07.10.19 19:19:03 MSK)

Ссылка

Ответ на: комментарий от Deleted 07.10.19 19:02:15 MSK

Тулза показывает финальное расположение блоков. Из этой картинки можно попытаться угадать, как работал алгоритм. Но если хочется понимать, как решения принимаются драйвером на ходу, придётся вникать в код.

i-rinat ★★★★★
(07.10.19 19:21:03 MSK)

Ссылка

У более традиционных ФС файлы заполняют логически связанные цепочки блоков ФС, геометрически (адресно) расположенных рядом (последовательно) на незаполненном данными других файлов пространстве или на пространстве удалённых ранее файлов. Запись выполняется согласно алгоритму последовательного чтения - «лифта» (или элеватора - забрать со всех мимо проезжаемых этажей пассажиров за один проезд вниз или вверх, смотря на какой этаж им требуется, и доставить их программе в правильно собранном виде, как и запрашивалось). Это делается с целью минимизации перепозиционирования считывающей головки винчестера при считывании логически связанных цепочек блоков с данными файла. Так как операций чтения, как правило, больше операций записи, оптимизация размещения данных должна быть проведена обязательно.

В UFS2 данные файла локализуются в определённой группе блоков или в смежных группах блоков. Групп блоков на слайсе (партиции, разделе, томе диска) может быть десятки и повреждения в одной или нескольких смежных группах приводят лишь к потерям соответствующих файлов, данные которых находятся в них.

iZEN ★★★★★
(08.10.19 09:34:19 MSK)
Последнее исправление: iZEN 08.10.19 09:43:55 MSK (всего исправлений: 2)

Ссылка

Ответ на: комментарий от Deleted 06.10.19 14:16:26 MSK

$MFT уменьшается в размере при недостатке места на диске. А так, на свежеформатированном разделе он довольно много места занимает.

Отложенного распределения

Чтобы был пушистый зверек при внезапном отключении. sync еще не приучился в консоли вбивать на всякий случай? У винды API дефрагментатора транзакционный.

anonymous
(08.10.19 13:18:50 MSK)

Ответ на: комментарий от anonymous 08.10.19 13:18:50 MSK

Отложенного распределения
Чтобы был пушистый зверек при внезапном отключении.

Ext4 решает, где будет лежать файл непосредственно перед записью данных из write-back кеша. NTFS решает сразу же, как только данные попадают в write-back кеш. Если питание внезапно пропадает до того, как происходит запись непосредственно данных, они будут утеряны и у ext4, и у NTFS. Отсутствие отложенного распределения не помогает в деле сохранности данных. Зато оно помогает предотвращать фрагментацию.

i-rinat ★★★★★
(08.10.19 18:34:22 MSK)

Ссылка

У XFS правила размещения данных таковы:

1. Вся ФС делится на какое-то количество (дефолтно 4) Allocation groups (AG). Каждая AG имеет своё собственное дерево inode'ов, поток обслуживающий чтение/запись inode'ов и т.п. Поэтому они как «разделы» в ФС.

2. Планированием записи данных и inode'ов на AG руководит allocator. Раньше их было более одного, сейчас вроде повыпиливали все кроме дефолтного. У дефолтного allocator'а очень простое, но при этом эффетивное поведение — директории по возможности создаются в разных AG (для распараллеливания доступа к ним), а файлы, лежащие в одной директории — в одной AG и при той же, что и директория, в которой лежат файлы.

3. XFS хранит для каждой AG два B-дерева. В каждом хранится информация об экстентах — группах блоков без данных (кусках свободного места, если проще). Одно B-дерево индексировано по размеру эксентов (чтобы можно было подобрать кусок подходщий по размеру файлу который записывается), а другое индексировано по первому блоку каждого экстента (соответственно понятно в каком порядке они идут на HDD).

4. Описание алгоритма выбора экстентов для записи файлов я не встречал («надо смотреть код»). Подозреваю, что он берёт за основу информацию из B-деревьев, текущую нагрузку и т.п., ну и пытается максимально эффективно распределить файлы внутри AG.

5. Размер минимального блока записи зависит от настроек создания ФС. Уже достаточно давно XFS умеет определять при создании оптимальный размер блока основываясь на параметрах RAID'а и/или диска на котором её создают.

6. У XFS есть достаточно хитрый алгоритм speculative preallocation (если честно, до сих пор не знаю как это переводится на русский). Если кратко, то это алгоритм «бронирования» места под будущее разростание файла. Соответственно некоторое пространство после файла закрепляется за ним на какое-то время (дефолтно 5 минут), а потом возвращается в «пул» доступных экстентов.

7. Ну и если так уж получилось, что файл записался не одним куском, то есть дефрагментатор xfs_fsr, который умеет, собирать фрагментированнные файлы (если файл не больше, чем объём свободного места в ФС).

chaos_dremel ★★
(09.10.19 03:32:52 MSK)

По какой логике заполняются файлами линуксовые ФС вроде ext4 и xfs — по порядку, от начала раздела к концу, или данные могут писаться куда угодно, хоть в начало, хоть в конец, хоть в середину?

https://opensource.com/article/17/5/introduction-ext4-filesystem

В чём смысл вопроса? Тебе лень гуглить и читать, об этом хотел сообщить? Или тебя интересует что-то конкретное?

anonymous
(09.10.19 04:34:00 MSK)