Posix threads: rwlock

posix threads

0

2

Задача: нужно создать кучу потоков, которые читают разделяемые данные. И есть один, который иногда (очень редко) меняет эти данные. Напрашивающееся решение: использовать rwlock. Это точно лучше, чем mutex. Но есть засада: при попытке получить rwlock на чтение может быть возвращена ошибка: достигнут предел на количество читателей.

Вопрос: как мне узнать заранее этот предел? Если я буду его знать, то у меня будут варианты: либо молча уменьшить макс. кол-во потоков до этой величины, либо сообщить юзеру, что я не могу обеспечить заданное им кол-во потоков, и завершиться после этого. Так как мне узнать (или задать) эту величину? Google даёт только ссылки либо на тот же man, который у меня и так есть, либо на пересказ этого же man’а своими словами с опечатками.

У меня программы должны работать десятилетиями, я не могу методом тыка определять такие величины: создавать потоки, лочить rwlock, затем при ошибке выдать сообщение о предельном кол-ве потоков, которое вбить гвоздями в программу. Сегодня это одна величина, а через 20 лет на другой версии GNU/linux она будет другой. Есть ли тут аналог sysconf(3)? Вот я могу запросить в run-time sysconf(_SC_OPEN_MAX). И исходя из этого не наступить на проблему, когда мне нужно держать открытыми много файлов одновременно.

А в случае POSIX threads вместо предсказуемого поведения программы мне предлагаются грабли. На которые я могу наступить в неизвестный мне заранее момент времени. Кто вообще писал такую спецификацию? Спек должен быть максимально конкретным, а не вот это вот расплывчатое, невнятное говно. Туда же до кучи: где мне получить величину PTHREAD_STACK_MIN? В man’е pthread_attr_setstacksize(3) она указана как 16384 байта (linux-specific). Я должен вбить гвоздями в программу константу 16384? Где, чёрт возьми, она за-define-нена? В pthread.h её нет. Ни sysconf(3), ни getrlimit(2) не дают её мне. Кто мне гарантирует, что через 10 лет она не изменится, и моя программа не перестанет работать? А где мне взять константу PTHREAD_THREADS_MAX, на которую ссылается man pthread_create(3p)?

Чем больше думаю на эту тему, тем меньше хочется использовать POSIX threads, а больше хочется заюзать напрямую clone(2). И получить предсказуемое поведение. И гори он огнём, этот POSIX с его невнятной спецификацией! Программа, написанная лет 20-25 назад с использованием linux-специфичного packet socket до сих пор работает и есть не просит.

Но всё-таки хочется же переносимости – по возможности. Может кто знает, где нарыть документацию на POSIX threads? Более внятную, чем тупо перепечатка man’ов на функции. И конкретно на rwlock: как получить (указать?) максимальное количество потоков-читателей? Opengroup не предлагать, там те же man’ы.

← Нужен совет от любителей плис

Бета-выпуск языка программирования Mojo 1.0 →

← 1 2 3 →

Ответ на: комментарий от SkyMaverick 08.05.26 08:47:48 MSK

Если уж на то пошло, так @nobody в принципе может кастомные rwlock-и сделать и не париться. Тоже, кроме атомиков, ничего не нужно и кода там не то, чтобы дофига писать.

Вопрос: atomic_compare_exchange_weak() – это откуда функция? Она из системной библиотеки? man про неё ничего не знает.

nobody ★★
(08.05.26 22:33:39 MSK) автор топика

Ответ на: комментарий от alnkapa 08.05.26 21:46:27 MSK

Используйте trylock с таймаутом.

И что делать по time-out? Ещё раз попытаться? Производительность просядет. Вылететь посреди вычислений с ошибкой? Это вряд ли кому-то понравится.

Обновите системные библиотеки и ядро.

Вышла новая версия стандарта, где можно заранее узнать ограничение на кол-во читателей?

nobody ★★
(08.05.26 22:44:07 MSK) автор топика

Ответ на: комментарий от nobody 08.05.26 22:19:37 MSK

Нет, мютекс это штука от ядра операционной системы. С++ный атомик из его библиотеки - надстройка над нативным компиляторным атомиком, а тот, в свою очередь - ассемблерный. Атомики есть не только в С++, в Си они тоже есть ничуть не хуже (основа везде одна и та же).

Есть такая инструкция CMPXCHG. Она сравнивает заданную величину с содержимым переменной, и, если они совпадают, записывает в переменную другую заданную величину, а если нет - возвращает то самое отличающееся содержимое переменной. Поскольку это одна ассемблерная инструкция, переключатель процессов ОС не может вклиниться в середине и разрушить её атомарность. Ещё в ассемблере есть префикс LOCK - он указывает процу на время выполнения инструкции сообщить остальным процам (ядрам), что им нельзя трогать память. Таким образом «LOCK CMPXCHG» атомарно и в многоядерных системах. Блокировка тут зашита в сам проц, никак не зависит от операционной системы и делается ровно на время выполнения инструкции, что очень эффективно.

Как с её помощью сделать атомарный инкремент, декремент и другие изменения переменной, думаю не надо объяснять.

Ядро, когда делает мютексы и прочие синхронизации, тоже использует эту штуку чтобы синхронизироваться между своими собственными тредами. Теоретически ты можешь с помощью атомика сделать свой собственный мютекс, rwlock или любой другой примитив синхронизации, с любыми нужными характеристиками, за одним исключением: если оказывается что блокировка занята другим тредом, тебе желательно уйти в сон, а это уже без сисколлов сделать не получится.

Есть синхронизация без сна - спинлок. Это аналог мютекса, но если спинлок занят, ожидающий тред проверяет его в бесконечном цикле снова и снова, тратя на это процессорное время, но зато об освобождении спинлока он узнает максимально быстро. Используется такое если под блокировкой делаются только очень простые и короткие действия, которые выгоднее подождать именно так, а не через сон.

firkax ★★★★★
(08.05.26 22:58:05 MSK)
Последнее исправление: firkax 08.05.26 23:02:05 MSK (всего исправлений: 1)

Ответ на: комментарий от r--r--r-- 08.05.26 09:54:09 MSK

сходил бы в гугл

Зачем на плохие сайты посылаешь?!

firkax ★★★★★
(08.05.26 22:59:22 MSK)
Последнее исправление: firkax 08.05.26 23:09:32 MSK (всего исправлений: 1)

Ответ на: комментарий от SkyMaverick 08.05.26 08:47:48 MSK

Это спинлоковый rwlock, надо бы уточнять. Обычный rwlock умеет отдавать тред на время ожидания.

firkax ★★★★★
(08.05.26 23:01:23 MSK)

Ответ на: комментарий от nobody 07.05.26 20:22:13 MSK

Не, не будет такой ситуации. Читателю незачем держать у себя указатель на постоянной основе (кэшировать). Быстро прошёлся по разделяемым данным..

Быстро прошёлся по разделяемым данным - это не является атомарной операцией, undestand?

anonymous2 ★★★★★
(09.05.26 02:55:07 MSK)

Ответ на: комментарий от nobody 08.05.26 22:33:39 MSK

stdatomic.h (в стандарте C11). По-идее это libc.

SkyMaverick ★★★★★
(09.05.26 08:22:11 MSK)

Ответ на: комментарий от firkax 08.05.26 23:01:23 MSK

Ну, как самый простой рабочий вариант, почему-бы и нет. Можно и усложнить по-желанию, но общая логика функционирования RWLock-ов не нарушится ИМХО.

SkyMaverick ★★★★★
(09.05.26 08:37:04 MSK)

Ответ на: комментарий от r--r--r-- 08.05.26 09:54:09 MSK

OMG, откуда я знаю, какой из результатов гуглопоиска ты считаешь валидным определением/критерием «блокирующего» и/или «синхронного» мьютекса.

Я по-моему уже вполне понятно объяснил, что coro::shared_mutex позволяет избежать блокировки потока выполнения (std::thread). И вообще необходимости в отдельном потоке, кроме тредпульных. А футпринт выполняющейся корутины небольшой.

MirandaUser2 ★★
(09.05.26 11:19:03 MSK)

Ответ на: комментарий от firkax 08.05.26 22:58:05 MSK

Спасибо за подробное объяснение.

nobody ★★
(09.05.26 20:48:57 MSK) автор топика

Ответ на: комментарий от anonymous2 09.05.26 02:55:07 MSK

Быстро прошёлся по разделяемым данным - это не является атомарной операцией, undestand?

А я и не писал, что она атомарная, я писал, что быстрая. По сравнению с сильно медленным писателем. При наличии 2 буферов вероятность нарваться на неконсистентные данные у читателя околонулевая. Но всё-же не 0, так что решение тоже не идеальное.

nobody ★★
(09.05.26 20:51:50 MSK) автор топика

Ответ на: комментарий от SkyMaverick 09.05.26 08:22:11 MSK

stdatomic.h (в стандарте C11). По-идее это libc.

Вот это то, что доктор прописал! Пойду читать С11. Пока что твоя идея в сочетании с идеями @KivApple и @Manhunt выглядит наилучшим решением. 2 буфера с разделямыми данными: один рабочий, другой резервный. В обоих по счётчику с атомарным доступом.

Читатель пытается инкрементировать счётчик в рабочем буфере. Если не получилось, пытается ещё. После успеха работает с буфером. Поработав, так же атомарно декрементирует счётчик. Вполне можно использовать просто цикл, как у тебя. Потому что переменная-счётчик занята только на время инкремента/декремента, а не на всё время работы потока с буфером.

Писатель просто проверяет счётчик в резервном буфере на 0. Если не 0, уходит поспать, после чего снова проверяет – пока она не обнулится. После этого набивает буфер данными. Вписывает его адрес вместо рабочего (запись машинного слова в память – это атомарная операция), а бывший рабочий записывает как резервный. После этого ни один читатель к нему уже не обращается, потому что буфер не рабочий. Так что при следующем запуске писателя новых читателей у резервного буфера не появится. Писателю нужно лишь дождаться, пока перестанут работать те, кто начал, когда буфер ещё был рабочим.

Вобщем, идея с подсчётом пользователей буфера – не трогать его, пока пользователи есть. Но не на rwlock, а на gcc-шных функциях атомарного инкремента/декремента – как у тебя в примере, с предсказуемой реализацией (в отличие от). Логика работы (псевдокодом) примерно такая:

разделяемый буфер {
  атомарный счётчик
  полезные данные
  } *рабочий, *резервный

цикл читателя:
  работа со своими данными
  когда нужны разделяемые:
    буфер = адрес рабочего
    инкрементировать счётчик в буфере, пока не получится
    работать с разделяемыми данными в буфере
    декрементировать счётчик в буфере, пока не получится

цикл писателя:
  select(socket)
  пока счётчик в резервном буфере != 0: поспать(немножко), снова проверить
  набить резервный буфер
  tmp = адрес рабочего буфера
  рабочий = адрес резервного
  резервный = tmp

nobody ★★
(09.05.26 21:44:51 MSK) автор топика

Ответ на: комментарий от nobody 09.05.26 21:44:51 MSK

2 буфера с разделямыми данными: один рабочий, другой резервный. В обоих по счётчику с атомарным доступом.

посмотри как у игроделов сделано-организованно, фреймы/кадры, один уходит в отображение, остальные заполняются и так по циклу. Их время жёстко давит, поэтому микро-алгоритмы конкуренции-смены_кадров там хорошо проработаны.

MKuznetsov ★★★★★
(10.05.26 17:49:19 MSK)

Ответ на: комментарий от nobody 09.05.26 21:44:51 MSK

Я не вчитывался, но кажется ты хочешь навелосипедить свой rwlock, при том что ты скорее всего не сможешь упереться в лимиты pthreads, потому что лимиты потоков ОС исчерпаются раньше.

Я предлагал вообще lock free, потому что в данном случае его несложно реализовать. А если делать полноценный rwlock, то лучше готовый.

KivApple ★★★★★
(10.05.26 17:52:42 MSK)

Ответ на: комментарий от MirandaUser2 09.05.26 11:19:03 MSK

OMG, откуда я знаю, какой из результатов гуглопоиска ты считаешь валидным определением/критерием «блокирующего» и/или «синхронного» мьютекса.

Подсказка - тот же, что и всё остальное прогрессивное человечество.

coro::shared_mutex позволяет избежать блокировки потока выполнения (std::thread)

А это совершенно ортогонально (вне-)блоковости мьютекса.

r--r--r--
(10.05.26 18:36:33 MSK)

Ответ на: комментарий от nobody 08.05.26 22:44:07 MSK

И что делать по time-out?

Превышение может означать:

Пишем дольше чем ожидаемый таймаут.
Количество читающих превышают возможности системы.

И то и другое, это конец системы (второе мягче). Тут не приходится говорить о производительности.

alnkapa ★
(10.05.26 20:30:29 MSK)

Ответ на: комментарий от nobody 09.05.26 21:44:51 MSK

Атомики и соответствующие операции над ними с всеми этими отношениями «happens before after» часть языковых стандартов после С++11 и идут вместе с компилятором и, соответсвенно, всё это должно работать без операционки (libc). Но это всё защищает только от «технической» гонки которая вызывает UB, от логической гонки которая, например, есть(вроде как) выше в Posix threads: rwlock (комментарий) не защищает. И, по-возмжности, возьми нормальный язык в котором есть готовые проверенные rwlock-и (плюсы, раст). Писать многопоточку и вообще программы которые - «должны работать десятилетиями» - на голой сишечке это издевательство над пользователями собой и здравым смыслом, а на С до С11 - просто рулетка

zurg ★★
(12.05.26 11:09:23 MSK)

Ответ на: комментарий от zurg 12.05.26 11:09:23 MSK

от логической гонки которая, например, есть(вроде как) выше

А в чем именно она заключается?

Manhunt ★★★★★
(12.05.26 18:08:20 MSK)

Ну во-первых, у тебя не должно быть потоков больше чем ядер, а столько потоков точно не переполнят счётчик читателей.

Во-вторых, можно считать что счётчик достаточно большой и падать при переполнении, потому что такое переполнение возможно только в некорректной программе, и до него дело не дойдёт потому что для этого нужно наспавнить много миллионов потоков. Не, можно конечно пытаться обрабатывать EAGAIN - бизилупиться, или спать, или пытаться прибивать лишние потоки, но это шиза.

В-третьих, может быть что более правильный паттерн для твоего кейса - atomic shared pointer, он позволяет не блочить ни читателей, ни писателя.

Чем больше думаю на эту тему, тем меньше хочется использовать POSIX threads, а больше хочется заюзать напрямую clone(2)

Как изменение способа спавнить потоки избавит тебя от необходимости их синхронизации, а следовательно rwlock’ов? Можешь, конечно, поискать альтернативную реализацию, но я не могу представить осмысленную реализацию rwlock без счётчика читателей (обычный mutex осмысленную реализацией rwlock не является).

И гори он огнём, этот POSIX с его невнятной спецификацией!

Не веди себя как ламер.

anonymous
(12.05.26 18:28:44 MSK)

Ответ на: комментарий от Manhunt 12.05.26 18:08:20 MSK

Как я понял ф-ия taf_rwlock_unlock вызывается и из читателей и из писателя, и если её вызов из читателя вклинится между циклами while и do внутри taf_rwlock_write_lock то писатель навечно заблокируется, т.к. RWLOCK_WRITE_FLAG уже установлен и выполнение внутри taf_rwlock_unlock пойдёт по ветке _rwlock_unlock_write(lock) и счётчик читателей не декрементируется навсегда оставшись больше нуля.

zurg ★★
(12.05.26 19:27:56 MSK)

Ответ на: комментарий от zurg 12.05.26 19:27:56 MSK

Кстати, действительно, соглашусь. Лучше разделить на две процедуры (которые инлайнятся) и вызывать нужный unlock вручную, не проверяя флаг.

upd. или слегка переделать unlock. Так гонок нет.

TAF_API int
taf_rwlock_unlock(uintptr_t m) {
    if (!m)
        return -1;
    rwlock_t *lock = (rwlock_t *)m;

    uint64_t flags = atomic_load(&lock->flags);

    uint64_t ref_count = flags & RWLOCK_COUNTER_MASK;
    if (ref_count != 0) {
       return _rwlock_unlock_read(lock);
    } else if (flags & RWLOCK_WRITE_FLAG) {
        return _rwlock_unlock_write(lock);
    }
    return 0;
}

SkyMaverick ★★★★★
(12.05.26 20:57:22 MSK)
Последнее исправление: SkyMaverick 12.05.26 21:24:40 MSK (всего исправлений: 2)

Ответ на: комментарий от zurg 12.05.26 19:27:56 MSK

Круто! Перечитал код, согласен с тобой.

Manhunt ★★★★★
(12.05.26 21:22:11 MSK)

Ответ на: комментарий от nobody 05.05.26 23:32:10 MSK

Насчёт «думаю оно скорее всего 32-битное»: мне неинтересны предположения по этому поводу, я и сам могу предположить, что там int, а не char. Но мне нужно гарантировать Заказчику работоспособность. Разница между «предполагаю» и «гарантирую» понятна же, да?

То есть, никакого ТЗ нет, а заказчику можно будет сказать «ну, у меня тут не менее PTHREAD_THREADS_MAX тридов допустимо, и у каждого от PTHREAD_STACK_MIN байт стека», я всё правильно понял?

anonmyous ★★★
(12.05.26 22:31:17 MSK)

Ответ на: комментарий от r--r--r-- 06.05.26 09:50:55 MSK

Когда последний раз из ядра целенаправленно удалили системные вызовы

man vm86

Ну не прям удалили, но задисейблили навсегда.

anonmyous ★★★
(12.05.26 22:43:55 MSK)

Ответ на: комментарий от nobody 06.05.26 01:01:05 MSK

sysconf(_SC_OPEN_MAX). Я знаю в run-time, сколько мне можно открыть файлов. И могу исходя из этого принимать решения в программе: закрыть какой-то из файлов, если

Ну и здесь прими. Только не заранее, а когда рвлок уже ошибку вернул. В чём проблема то?

anonmyous ★★★
(12.05.26 22:46:34 MSK)

Ответ на: комментарий от anonmyous 12.05.26 22:43:55 MSK

vm86

Именно.

r--r--r--
(12.05.26 23:04:39 MSK)

Ответ на: комментарий от SkyMaverick 12.05.26 20:57:22 MSK

И так тоже сомнительно/хрупко выглядит, лучше всё-таки разделить на два анлокера каждый из которых вызывается только из потоков своего типа

zurg ★★
(14.05.26 11:06:35 MSK)

Ответ на: комментарий от zurg 14.05.26 11:06:35 MSK

Так, как-минимум, в таком варианте ничто не мешает читателям освобождаться, что есть, подтверждаю, в изначальном варианте. Они не увеличивают счётчик (так как стоит флаг присутствия писателя и новые читатели ждут), но писатель, в тоже время, ждёт пока освободятся активные читатели. Ну вот, соответственно, в unlock

если есть читатели, то их и освобождаем (писатель если и есть, то в состоянии ожидания)
если нет читателей и стоит флаг писателя, значит освобождается писатель

лучше всё-таки разделить на два анлокера каждый из которых вызывается только из потоков своего типа

Ну, можно и так. Я же не спорю.

SkyMaverick ★★★★★
(14.05.26 11:25:17 MSK)

Ответ на: комментарий от Enthusiast 06.05.26 02:04:12 MSK

За счёт этого общая производительность многопоточной программы становится не просто быстрой, а недостижимо быстрой для дурней, со сих пор пишущих на «замках».

Так твоя «служба» и есть в этом случае самый надежный «замок», ну :)

paddlewan ★
(19.05.26 23:35:32 MSK)