Семафоры и завершение процесса.

0

2

Допустим я создал/открыл семафор через sem_open. Сделал sem_wait и вошел в критическую секцию. И тут произошло чудо^W нечто нехорошее, процесс или упал или был убит извне через kill, до вызова sem_post. Семафор получается остался занятым и другие процессы не смогут получить доступ к их кретической секции. Можно ли разрулить эту ситуацию?

Ссылка

←	Мануал по написанию gegl плагина для GiMP

Странный fork()

→

Кажется, в структуре sembuf есть поле флагов sem_flg, в которое можно добавить флаг SEM_UNDO. Если флаг установлен, то ядро будет следить за изменениями значения семафора. Если процесс, изменивший значение семафора, рухнет (или «забудет» сделать обратное изменение при выходе из крит.секции), то ядро скорректирует значение семафора, чтобы не было вечной блокировки ждущих процессов. Как-то так. /* давно не писал с семафорами, могу где-то ошибаться */

DeVliegendeHollander ★★
(28.08.12 21:30:35 MSK)

Например, обрабатывать сигналы SIGSEG и прочее.

trex6 ★★★★★
(28.08.12 21:31:04 MSK)

Ссылка

Ответ на: комментарий от DeVliegendeHollander 28.08.12 21:30:35 MSK

Хм интересно. Но это немного другие семафоры. Ну да ладно, это не принипиально.

Dudraug ★★★★★
(28.08.12 21:33:05 MSK) автор топика

Ссылка

Думаю, минут 10 тебе хватит, чтобы написать нужную программу, запустить и в момент sleep() сделать ей kill -9 (так, чтобы она нечего не поняла).

Затем снова запустить, чтобы проверить состояние семафора. Еще есть команды ipcs, ipcrm, ipcmk, они тоже про какие-то семафоры.

~~x_hash~~ ★
(29.08.12 00:24:58 MSK)

Ссылка

Я могу ошибаться, но мне кажется, ты хочешь странного. Если у тебя упал один из рабочих потоков, значит у тебя возникла аварийная ситуация и ее надо обрабатывать, а не продолжать работу, как ни в чем не бывало. Тут уж не до блокировок, хотя и их можно разрулить в обработке исключений.

~~delete83~~ ★★
(29.08.12 06:24:19 MSK)

Ответ на: комментарий от delete83 29.08.12 06:24:19 MSK

Ога, вотчдог перезапустит умерший процесс и матернется в лог. А как еще обрабатывать? Особенно если это случилось 1го января час ночи.

Reset ★★★★★
(29.08.12 11:20:29 MSK)

Ссылка

Ответ на: комментарий от delete83 29.08.12 06:24:19 MSK

аварийная ситуация и ее надо обрабатывать, а не продолжать работу

Не всегда. Для задач «требующих повышенной надежности», сразу же оговариваются: в программах всегда есть баги, программы всегда «падают» и т.п. Если принять это как истину, то один из методов борьбы с этим это подготовиться к некорректному поведению, и создавать программы так, что они могут продолжать работать даже если что-то где-то сломалось.

Для этого придумывался robust mutexes (ядро разлочит mutex взятый потоком, если поток случайно умрет). Почти такой же функционал предоставляет SEM_UNDO для семафоров, с тем отличием, что robust mutex'ы могут сообщать, что мьютекс разлочился в силу смерти потока (EOWNERDEAD + pthread_mutex_consistent), и тред среагирует соответствующим образом. У семафоров такой механизм оповещения об ошибке нужно самому придумывать.

Если же хватает просто mutex'a, то можно заменить семфор на pthread mutex + pthread_mutexattr_setpshared + pthread_mutexattr_setrobust.

~~hexdump01010101~~
(29.08.12 12:06:19 MSK)

Ответ на: комментарий от hexdump01010101 29.08.12 12:06:19 MSK

Вы меня не поняли. Баги, конечно же, есть всегда, но это не значит, что падение потоков нужно игнорировать. У вас потоки просто так крутятся или обрабатывают какие-то свои уникальные наборы данных? Вы же не хотите эти данные потерять вместе с потоком? Что мешает отлавливать падения и по возможности проводить диагностику, а в конце перезапускать поток с этими же данными?

~~delete83~~ ★★
(29.08.12 13:19:58 MSK)

Ответ на: комментарий от hexdump01010101 29.08.12 12:06:19 MSK

Если же хватает просто mutex'a, то можно заменить семфор на pthread mutex + pthread_mutexattr_setpshared + pthread_mutexattr_setrobust.

Это типо глобальный мьютекс? А оно везде работает? У меня просто эмбедед и не понятно чо там есть, чего нет.

Dudraug ★★★★★
(29.08.12 13:36:25 MSK) автор топика

Ответ на: комментарий от delete83 29.08.12 13:19:58 MSK

что падение потоков нужно игнорировать

Ну и никто не говорит про игнорирование. Вы же сами говорите:

Что мешает отлавливать падения и по возможности проводить диагностику

Так без SEM_UNDO/robust mutexes вы просто не сможете ничего отлавливать, так как у вас будет deadlock. Кто разблокирует mutex/semaphore?

А со средствами экстренной разблокировки вы отловите ситуацию, поймете, что поток/процесс умер, проведете «диагностику», и попробуете заново (или залогируете, что вот такая-то часть данных вызывает падение, и пойдете дальше обрабатывать, другие данные).

~~hexdump01010101~~
(29.08.12 14:32:52 MSK)

Ссылка

кретической

кретическое программирование - это такая эзотерическая практика экстремального :)

slackwarrior ★★★★★
(29.08.12 14:42:02 MSK)

Ссылка

Ответ на: комментарий от Dudraug 29.08.12 13:36:25 MSK

Это типо глобальный мьютекс?

Да, в shared memory можно создать.

А оно везде работает?

Если соответствует POSIX.1c. Но всегда смотреть нужно по обстоятельствам. Linux, например, на 100% не соответствует стандартам, и не будет (нету такой цели у разработчиков), но именно эта фича в glibc/Linux работать должна.