Какие функции для работы с файлами на си вы предпочитаете?

FILE* для буфферизированного доступа. Дёргать write(2) на каждые несколько записанных байт крайне медленно.
Ну и write(2) когда нужно произвести одну операцию записи на дескриптор

mittorn ★★★★★
(01.10.25 18:45:13 MSK)

Те, которые работают с GFile

anonymous
(01.10.25 19:05:36 MSK)

Ссылка

Первые, чтобы эта libc’шная кривожопая буферизация не мешалась под ногами, и чтобы не пользоваться API придуманным идиотами, например вспоминать какой режим для fopen что значит, и достаточно ли вызвать fflush перед закрытием записываемого файла.

anonymous
(01.10.25 19:26:56 MSK)

Ссылка

зависит от задачи. выше уже написали про буферизацию. а иногда и mmap нужно применять, для большей эффективности. если же просто в небольшой файл писать, то достаточно fopen/fwrite/fseek и же с ними. это часть стандарта С. прочие реализации могут зависеть от платформы.

Iron_Bug ★★★★★
(01.10.25 19:31:13 MSK)
Последнее исправление: Iron_Bug 01.10.25 19:31:32 MSK (всего исправлений: 1)

Ответ на: комментарий от Iron_Bug 01.10.25 19:31:13 MSK

и же с ними

Может «и иже с ними»?

zx_gamer ★★★
(01.10.25 19:52:19 MSK)

Ответ на: комментарий от zx_gamer 01.10.25 19:52:19 MSK

да. хотя опечатка забавная. с некоторыми вещами я бы пожелала, чтобы с ними была Ж :) но к сишке это не относится, в любом случае.

Iron_Bug ★★★★★
(01.10.25 19:59:01 MSK)

Ссылка

я обычно FILE. А в целом без разницы, потому что они во-первых конвертируются друг в друга, во-вторых, по-хорошему конечно лучше использовать mmap, если возможно. А еще лучше - dio через какой-нибудь io_uring, а еще лучше - купить специальное железо с поддержкой ZNS :))

Lrrr ★★★★★
(01.10.25 20:07:12 MSK)

Ссылка

Из этих двух - сисколлы с fd. Для некоторых частных случаев (печать логов и других append-only потоков данных в файл, или построчное чтение файла) - свои обёртки.

firkax ★★★★★
(01.10.25 22:08:14 MSK)

Ссылка

fs.c из Darkplaces.

a1ba ★★★★
(02.10.25 00:19:11 MSK)

Ответ на: комментарий от mittorn 01.10.25 18:45:13 MSK

Дёргать write(2) на каждые несколько записанных байт крайне медленно.

write() гарантирует что данные попадут в page cache ярда. А попадут ли данные физически на диск – зависит от ядра и файловой системы. Даже вызов fsync() / fdatasync() не гарантируют, что данные физически окажутся на диске. К примеру, на ZFS данные попадут в ZIL. Фактически сброс на диск произойдёт позже, в рамках транзакционного commit’а.

iron ★★★★★
(02.10.25 00:25:22 MSK)

Ответ на: комментарий от iron 02.10.25 00:25:22 MSK

Да, использование сисколов не гарантирует что буфферизации не будет и данные попадут на диск. Но зато гарантирует, переключение в ядро с соответствующим оверхедом. На мелких порциях данных это может понизить производительность в десятки раз и оверхед от аллокации буффера для stdio на фоне этого окажется незначительным.
Ну и не стоит забывать, что stdio - стандартный для си, а вот open/read/write - только в рамках posix и на не-posix системах могут отсутствовать или вести себя иначе (в windows это скорее совместимость с dos, а не posix)

mittorn ★★★★★
(02.10.25 01:26:38 MSK)
Последнее исправление: mittorn 02.10.25 01:29:27 MSK (всего исправлений: 1)

Ссылка

FILE* и fopen()

PunkPerson ★
(02.10.25 05:37:52 MSK)

Ссылка

Если я просто читаю файл, то FILE * функции мне нормально.

Bfgeshka ★★★★★
(02.10.25 07:17:26 MSK)

Ссылка

Ответ на: комментарий от iron 02.10.25 00:25:22 MSK

Даже вызов fsync() / fdatasync() не гарантируют

Гарантируют, иначе приложение надёжно записывающее данные сделать было бы принципиально невозможно.

К примеру, на ZFS данные попадут в ZIL

А ZIL где, по-твоему, не на диске?

anonymous
(02.10.25 16:00:55 MSK)

Ответ на: комментарий от anonymous 02.10.25 16:00:55 MSK

Гарантируют

В мане написано, что нет.

~~u5er~~ ★★★
(02.10.25 16:05:22 MSK) автор топика

90% случаев с FILE *, читать, форматировано писать, перемещаться по файлу, всё что нужно, есть, это просто удобно и не накладно. Дескрипторы, редко, если они изначально явно нужны, или требуется в них «сконвертировать», настолько редко что каждый раз в справку лезу.

LINUX-ORG-RU ★★★★★
(02.10.25 16:41:44 MSK)

Ссылка

Юзаем open(), close(), write(), read() на базе int fd. Буфферизацию реализуем своими средствами, так как-то нативнее и кошернее и понятнее. Обычно слой, который хочет записывать в файл, отдаёт уже цепочки блоков по 4 КБ или длиннее, так что проблем нет. Буфферизация в серьёзном приложении всегда какая-то реализована, потому что иначе бы у нас получилась зависимость от библиотеки, которая даёт доступ к файлу. От библиотеки требуется минимум фич - никаких там буферов, а прямой сискол и все довольны. Условно, мы делаем что-то типа MySQL, а там чтение целыми страницами да и записи то же, но обычно более длинными кусками и в самой софтине есть «кеш страниц» и короче всё в страницах меряется и пишется, ничего меньше страницы читать ниоткуда смысла никогда нет. А чаще и десятками мегабайт. Нахрен все эти буферизованые fopen() не уссались нам. Так в целом как-то проще и понятнее жить - не зависишь от буферов в библиотеке, знаешь что их там просто нет. Ну и не факт, что политика «буферирования» внутри libc-шного fread() прям очень оптимальна для твоей приложеньки.

lesopilorama
(02.10.25 20:02:33 MSK)
Последнее исправление: lesopilorama 02.10.25 20:09:12 MSK (всего исправлений: 3)

Ссылка

Ответ на: комментарий от iron 02.10.25 00:25:22 MSK

fsync()

Про эту штуку я привык думать не более чем как про fence, ну типа барьер - никакие write() после fsync() не будут на диске раньше, чем те write() которые были до fsync()… Возможно это правильное понимание.

lesopilorama
(02.10.25 20:07:23 MSK)

Ответ на: комментарий от lesopilorama 02.10.25 20:07:23 MSK

Про эту штуку я привык думать не более чем как про fence, ну типа барьер - никакие write() после fsync() не будут на диске раньше, чем те write() которые были до fsync()… Возможно это правильное понимание.

Нигде даже намека на такие гарантии не видел.

urxvt ★★★★★
(02.10.25 20:14:53 MSK)

Ответ на: комментарий от urxvt 02.10.25 20:14:53 MSK

Нигде даже намека на такие гарантии не видел.

Я не думаю что они хоть где-то есть - слишком дорого. А тот кто пишет в те же блоки что другой процесс / поток в это время пытается засинкать - ну что ж, ССЗБ.

bugfixer ★★★★★
(02.10.25 20:22:01 MSK)

Ответ на: комментарий от u5er 02.10.25 16:05:22 MSK

Читай внимательнее, «нет» там написано про директорию и даже написано как сделать чтобы «да».

anonymous
(02.10.25 20:26:37 MSK)

Предпочитаю те, которые работают с fd. Не люблю ненужные зависимости включая зависимость от libc.

vbr ★★★★★
(02.10.25 20:51:47 MSK)

Ссылка

Ответ на: комментарий от urxvt 02.10.25 20:14:53 MSK

Нигде даже намека на такие гарантии не видел.

А ты логику включи, увидишь что они есть

no-dashi-v2 ★★★★
(02.10.25 20:54:47 MSK)

Ссылка

Ответ на: комментарий от anonymous 02.10.25 20:26:37 MSK

Я читал тут

https://www.opennet.ru/man.shtml?topic=fsync&category=2&russian=0

В случае если у жёсткого диска разрешена запись кэша, данные могут фактически не быть сохранены после выполнения fsync/fdatasync.

~~u5er~~ ★★★
(02.10.25 20:55:46 MSK) автор топика

Ответ на: комментарий от urxvt 02.10.25 20:14:53 MSK

Нигде даже намека на такие гарантии не видел.

Ну это вообще минимально разумные гарантии. fsync() обычно по-сути ради них и вызывают (в мире движков СУБД, например). Если он прям на диск физически ничего не запишет, то хотя-бы эту гарантию даст, её хватит всем как 640 кб. Чтобы НЕ начинать запись чего-то, что требует наличия уже чего-то другого записанного на диск - ведь fsync() логически вызывают именно ради этого, не для чего-то ещё. Нет, ещё бывает что от fsync() хотят прям типа гарантии «записалось» в банках, чтобы если три разных сервера физически записали что-то, то можно клиенту отвечать что бабло перевелось - но там и железо специальное, где все мамой поклялись, что между fsync и железом есть взаимопонимание. Да и вообще банки строят свои IT-решения скорее вокруг термина «последовательно», а не термина «гарантированно записалось». Ну всмысле, сохранение порядка операций важнее, чем их сохранность. Реальное состояние бабла всё равно подбивают по ночам последовательным перепрочитыванием логов, а не прямо сразу в базе днём во время перевода денег.

lesopilorama
(02.10.25 21:00:34 MSK)
Последнее исправление: lesopilorama 02.10.25 21:06:54 MSK (всего исправлений: 5)

Ответ на: комментарий от bugfixer 02.10.25 20:22:01 MSK

А тот кто пишет в те же блоки что другой процесс / поток в это время пытается засинкать - ну что ж, ССЗБ.

Какие блоки? Блоки диска что-ли физические? Речь вообще не про это. Если в одни и те же блоки диска кто-то пытается писать «параллельно», то это уже дурка по определению, race condition называется и просто психи, тут fsync уже не поможет, только морг

lesopilorama
(02.10.25 21:02:13 MSK)
Последнее исправление: lesopilorama 02.10.25 21:02:31 MSK (всего исправлений: 1)

Ответ на: комментарий от u5er 02.10.25 20:55:46 MSK

Я читал тут

Ты большой молодец, а теперь или и почитай нормальные маны на нормальном языке. А на опеннете, чисто чтобы поржать над собой, почитай раздел ПЕРЕВОД.

anonymous
(02.10.25 22:09:43 MSK)

Ответ на: комментарий от lesopilorama 02.10.25 21:00:34 MSK

У тебя каша в голове. Нельзя никакие надёжные хранилища строить на fsync который «прям на диск физически ничего не запишет». СУБД, к тому моменту когда возвращает клиенту успешный ответ на COMMIT, обязана данные положить в надёжное хранилище, а это только fsync() == 0. Иначе, условно, клиенту вернётся подтверждение что деньги переведены, он отгрузит товар покупателю, а у СУБД мигнёт свет и окажется что никаких денег никуда не поступало. Вот с такими свойствами fsync будет барьером и на нём можно строить гарантии последовательности, но это всего лишь следствие из основного и единственного свойства.

anonymous
(02.10.25 22:43:22 MSK)

Ответ на: комментарий от lesopilorama 02.10.25 21:02:13 MSK

Если в одни и те же блоки диска кто-то пытается писать «параллельно»,

Почему параллельно? Поток 1 записал что-то, и ушёл в fsync()/fdatasync(). Второй поток в это время начинает писать в те же блоки (офсеты в файле). Race здесь нет, а вот неопределённость что будет на диске на выходе из fsync() - есть.

bugfixer ★★★★★
(02.10.25 23:12:39 MSK)

Ответ на: комментарий от a1ba 02.10.25 00:19:11 MSK

и чем эта экзотика более лучше, чем всё прочее, стандартное?

Iron_Bug ★★★★★
(02.10.25 23:13:52 MSK)

Ответ на: комментарий от anonymous 02.10.25 22:43:22 MSK

особо хитрожопые СУБД имеют свои драйвера работы с дисками. первыми в этом деле были Oracle, насколько я помню. сейчас, наверное, есть и другие базы, которые это делают. диски сами по себе тоже могут быть хитрожопыми, со всякими там снимками состояний и прочего.

но так просто вот чтобы на сто процентов гарантировать запись на винт из любого ЯП - это нереально. слишком много слоёв абстракции. сам файл может быть отображён в память, или оказаться оверлеем, например. в общем, много всяких нюансов.

а с переводами денег всё более надёжно: там везде «двойная бухгалтерия», по сути. ведутся квитки подтверждения транзакций на двух сторонах и потом сверяются. чтобы на двух сторонах сразу свет одновременно моргнул - это маловероятно.

Iron_Bug ★★★★★
(02.10.25 23:22:35 MSK)
Последнее исправление: Iron_Bug 02.10.25 23:25:45 MSK (всего исправлений: 2)

Ответ на: комментарий от Iron_Bug 02.10.25 23:22:35 MSK

особо хитрожопые СУБД имеют свои драйвера работы с дисками

Какая разница? Интерфейс с системой и требования к нему всегда одни и те же.

диски сами по себе тоже могут быть хитрожопыми, со всякими там снимками состояний и прочего.

Какая разница? Интерфейс с дисками и интерфейс с ними всегда один и тот же.

anonymous
(02.10.25 23:26:45 MSK)

Ответ на: комментарий от bugfixer 02.10.25 23:12:39 MSK

Race здесь нет, а вот неопределённость что будет на диске на выходе из fsync() - есть.

Это и есть race:))

anonymous
(02.10.25 23:28:12 MSK)

Ссылка

Ответ на: комментарий от anonymous 02.10.25 23:26:45 MSK

разница в том, что база подгребает под себя весь путь от получения данных до физической записи на винт. но, конечно, это не поможет от внезапного вырубания сервера. хотя у серверов обычно есть УПСы и прочее на этот случай, чтобы успеть сохранить несохранённое. а у совсем важных серверов есть резервные системы питания.

интерфейс тоже может быть «не один и тот же», если ты лезешь через свой драйвер, например.

Iron_Bug ★★★★★
(02.10.25 23:30:31 MSK)

Ссылка

Ответ на: комментарий от anonymous 02.10.25 22:09:43 MSK

нормальные
нормальном

Получаешь клоуна за использование этого слова без указания керитериев.

теперь или и почитай нормальные маны на нормальном языке

https://man7.org/linux/man-pages/man2/fsync.2.html
https://man.archlinux.org/man/fsync.2.ru

$ man 2 fsync

...
HISTORY
       POSIX.1-2001, 4.2BSD.

       In Linux 2.2 and earlier, fdatasync() is equivalent to fsync(), and so
       has no performance advantage.

       The fsync() implementations in older kernels and lesser used
       filesystems do not know how to flush disk caches.  In these cases disk
       caches need to be disabled using hdparm(8) or sdparm(8) to guarantee
       safe operation.

       Under AT&T UNIX System V Release 4 fd needs to be opened for writing.
       This is by itself incompatible with the original BSD interface and
       forbidden by POSIX, but nevertheless survives in HP-UX and AIX.
...

Так или иначе, приписка про тонкость с кешем есть во всех манах.

~~u5er~~ ★★★
(03.10.25 00:20:02 MSK) автор топика
Последнее исправление: u5er 03.10.25 00:20:44 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от anonymous 02.10.25 22:43:22 MSK

Нельзя никакие надёжные хранилища строить на fsync который «прям на диск физически ничего не запишет».

Можно. Гарантии сериализации записей - единственное, что интересно. Например такая штука как ext3 спокойно живёт, тогда как никакая запись на диск ни в какой момент времени не гарантирована, даже в журнал. Гарантируется только сериализация записей. Так-то. Дальше нечетал поток бреда, бугага.

lesopilorama
(03.10.25 10:58:36 MSK)

Ссылка

Ответ на: комментарий от anonymous 02.10.25 22:43:22 MSK

СУБД, к тому моменту когда возвращает клиенту успешный ответ на COMMIT, обязана данные положить в надёжное хранилище, а это только fsync() == 0

А если я надежно записал на диск, а потом по серверу топором перехерачили. Получается зря COMMIT возвращал и бабло снова просрано! Интересна только сериализация.

lesopilorama
(03.10.25 11:00:38 MSK)

Ссылка

Ответ на: комментарий от bugfixer 02.10.25 23:12:39 MSK

Второй поток в это время начинает писать в те же блоки (офсеты в файле). Race здесь нет, а вот неопределённость что будет на диске на выходе из fsync() - есть.

Ну это и есть race. Конечный эффект не предсказуем - типичный race из учебника

lesopilorama
(03.10.25 11:02:30 MSK)

Ответ на: комментарий от Iron_Bug 02.10.25 23:22:35 MSK

но так просто вот чтобы на сто процентов гарантировать запись на винт из любого ЯП - это нереально.

Это уровень ядра операционной системы.

там везде «двойная бухгалтерия»

это называется двойная запись, а «двойная бухгалтерия» это кое-что другое.

soomrack ★★★★★
(03.10.25 11:10:09 MSK)

Ссылка

Ответ на: комментарий от Iron_Bug 02.10.25 23:13:52 MSK

Тем что может монтировать архивы в виртуальную ФС. :)

Но на самом деле в обычных проектах, где никакая виртуальная файловая система не нужна, я бы выбрал и выбираю stdio.

a1ba ★★★★
(03.10.25 11:36:15 MSK)

Ответ на: комментарий от lesopilorama 02.10.25 20:07:23 MSK

FSYNC должен гарантировать, что данные записались физически в нужные секторы диска. Для этого в протоколах SATA/NVME/SCSI имеются специальные команды, которые операционная система посылает, когда приложение вызывает fsync.

Конечно диску ничего не мешает игнорировать эти команды, как и любые другие команды, включая твои фантазии про упорядочивание (например он может всё записывать в DRAM-кеш, а потом выбирать понравившиеся куски и переносить их на диск, игнорируя fsync и любой порядок, и всё во имя производительности), но это уже вопрос философский - называть ли такое устройство исправным или нет. С точки зрения компьютера всё, что он мог сделать для сохранения данных - он сделал.

vbr ★★★★★
(03.10.25 12:34:06 MSK)
Последнее исправление: vbr 03.10.25 12:36:41 MSK (всего исправлений: 2)

Ответ на: комментарий от vbr 03.10.25 12:34:06 MSK

FSYNC должен гарантировать, что данные записались физически в нужные секторы диска.

С тех пор пятеро померло. Это старые идеалистические представления про fsync как про коммунизм, нынче надо отдельно выяснять умеет он это или нет, но если умеет хотя-бы быть барьером записи, что записи после него не переупорядочиваются с записями до него, то уже супер и достаточно.

lesopilorama
(03.10.25 12:36:43 MSK)

Ссылка

Ответ на: комментарий от vbr 03.10.25 12:34:06 MSK

Короче я тут почитал… fsync() не гарантирует в реальном мире вообще ничего - ни просто записей на диск, ни даже моих этих нафантазированных «барьеров записи». Никакой там сериализации.

Итоговый ответ про fsync будет такой: надо выяснять как в конкретной реализации (ФС + драйверы диска + диск) это будет отрабатывать. В большинстве случаев, успешный возврат fsync() говорит только о том, что ФС сказала драверу диска записать на диск всё что ФС давно хотела. Как эту просьбу выполнил драйвер и сам диск - предмет научных исследований на конкретной железке.

Серьёзный банк-ентерпрайз, использующий fsync в коде, будет отличаться от прочих организаций тем, что отвечающие за работу софта ОТЧЁТЛИВО себе представляют, что будет происходить при вызове fsync в ФС, в драйвере диска и на физическом уровне конкретной железки. И естественно, поменять любой из этих компонентов никакому админу они не позволят.

lesopilorama
(03.10.25 12:49:11 MSK)
Последнее исправление: lesopilorama 03.10.25 12:51:57 MSK (всего исправлений: 1)

Ответ на: комментарий от lesopilorama 03.10.25 12:49:11 MSK

А ещё у вендоров дисков есть секретные команды для настоящего fsync, которые они выдают под супер-жёстким NDA. И это не шутка, кстати.

И происходит это понятно почему. Тот, кто сделает fsync работающим, как положено, провалит все бенчмарки. Когда все вокруг жульничают, тебе остаётся только жульничать.

Как я написал - считать ли такой диск исправным - вопрос философии.

vbr ★★★★★
(03.10.25 12:59:11 MSK)
Последнее исправление: vbr 03.10.25 12:59:31 MSK (всего исправлений: 1)

Ответ на: комментарий от vbr 03.10.25 12:59:11 MSK

А ещё у вендоров дисков есть секретные команды для настоящего fsync, которые они выдают под супер-жёстким NDA. И это не шутка, кстати.

Охотно верю и так и думал) В серьёзных приложениях вообще начинает веять духом «хочешь чтобы хорошо работал софт - делай для него своё железо»…

lesopilorama
(03.10.25 13:00:45 MSK)

Ссылка

Предпочитаю os.OpenFile()

LongLiveUbuntu ★★★★★
(03.10.25 13:22:38 MSK)

Ответ на: комментарий от LongLiveUbuntu 03.10.25 13:22:38 MSK

Это на го что ли?

~~u5er~~ ★★★
(03.10.25 13:23:43 MSK) автор топика

Ответ на: комментарий от u5er 03.10.25 13:23:43 MSK

Да. Если тебе не нужен реалтайм, микроконтроллеры там, смело пересаживайся.

LongLiveUbuntu ★★★★★
(03.10.25 13:33:18 MSK)

Ссылка

Ответ на: комментарий от lesopilorama 03.10.25 11:02:30 MSK

Конечный эффект не предсказуем - типичный race из учебника

«Конечный» то как раз очень даже предсказуем. А вот как вы собираетесь узнавать что действительно попало на диск - мне неведомо. Питание выдёргивать?

bugfixer ★★★★★
(03.10.25 15:09:01 MSK)
Последнее исправление: bugfixer 03.10.25 15:34:50 MSK (всего исправлений: 1)

Ответ на: комментарий от a1ba 03.10.25 11:36:15 MSK

ну, есть разные ФС, которые вообще применяют сжатие данных. правда, я сто лет их не применяла, потому что сейчас это неактуально. да и медленно это всё. как и вывод в stdio. много туда не выведешь. будет тормозить.

Iron_Bug ★★★★★
(03.10.25 16:11:13 MSK)

Похожие темы