fork() is evil;

posix_spawn() наше всё

anonymous
(31.05.21 11:11:17 MSK)

Ссылка

Все дело в волшебных, нет, не пузырьках, а в волшебных сигналах. А вы думали, почему нет fork в ставших обычными языках со сборкой мусора?

anonymous
(31.05.21 11:19:42 MSK)

Медленно до них доходит. fork() изначально defective by design, он ломает логику программы и взаимодействие с внешними ресурсами. Для того чтобы это работало нормально часто требуется костыль в виде обработчика afterFork. Также механизм COW используемый в fork() опасен в плане неконтролируемого роста памяти и в результате нехватки памяти. Например если куча отображена с помощью COW, то при изменении небольшого участка будет скопирована вся страница и в результате в скором времени с большой вероятностью будет скопирована вся куча.

X512 ★★★★★
(31.05.21 11:22:04 MSK)

Ссылка

В статье автор замечает, что CreateProcess и posix_spawn сложны, потому что в один вызов функции засовываются все на свете опции запуска процесса. Я должен заметить, что в форточках на нативном уровне создание процесса и создание главного потока процесса — это две разные задачи, которые выполняются по очереди. То есть, создается процесс, в него грузится выполняемый код, создается главный поток, которому скармливается загруженный код на выполнение — и всё это безо всяких там форков. vfork() делает примерно то же, но наоборот — родительский процесс как бы вселяется в новосозданный дочерний и производит там инициализацию. При этом родительский поток/процесс на время инициализации висит.

А что мешает сделать интерфейсы, которые позволили бы родительскому процессу произвести инициализацию дочернего как это удобно родительскому, без остановки асинхронной обработки других запросов? Или даже передать инициализацию дочернего процесса системной службе. Кривые POSIX интерфейсы, которые испокон веков однопоточны и синхронны?

byko3y ★★★★★
(31.05.21 11:43:45 MSK)
Последнее исправление: byko3y 31.05.21 11:44:39 MSK (всего исправлений: 1)

Ответ на: комментарий от byko3y 31.05.21 11:43:45 MSK

Я должен заметить, что в форточках на нативном уровне создание процесса и создание главного потока процесса — это две разные задачи, которые выполняются по очереди.

В Haiku также. Она вообще во многих чертах на Windows NT похожа. В Линуксе вообще потоков нет, это процессы с общим адресным пространством, что задаётся флагом системного вызова clone.

А что мешает сделать интерфейсы, которые позволили бы родительскому процессу произвести инициализацию дочернего как это удобно родительскому, без остановки асинхронной обработки других запросов?

Это как? Создать недоинициализированный процесс и потом с помощью API его настраивать и инициализировать?

X512 ★★★★★
(31.05.21 12:09:48 MSK)

Ответ на: комментарий от X512 31.05.21 12:09:48 MSK

В Линуксе вообще потоков нет, это процессы с общим адресным пространством

Это бессмысленное жонглирование словами с непонятной целью исказить общепринятые формулировки. Единицы учёта шедулера ОС в общем адресном пространстве = «потоки».

LamerOk ★★★★★
(31.05.21 12:24:22 MSK) автор топика

Ссылка

Ответ на: комментарий от X512 31.05.21 12:09:48 MSK

В Линуксе вообще потоков нет, это процессы с общим адресным пространством, что задаётся флагом системного вызова clone.

Значит у них пиды разные? А если проверю?

anonymous
(31.05.21 12:24:48 MSK)

Ответ на: комментарий от anonymous 31.05.21 11:19:42 MSK

почему нет fork в ставших обычными языках со сборкой мусора?

Вполне себе есть вообще-то.

~~WitcherGeralt~~ ★★
(31.05.21 12:24:49 MSK)

Ответ на: комментарий от anonymous 31.05.21 12:24:48 MSK

Значит у них пиды разные? А если проверю?

Они разные, проверяйте. У каждого потока свой PID.

X512 ★★★★★
(31.05.21 12:35:42 MSK)
Последнее исправление: X512 31.05.21 12:38:58 MSK (всего исправлений: 1)

Ответ на: комментарий от X512 31.05.21 12:35:42 MSK

Да неужели.

#include <future>
#include <boost/process/environment.hpp>

int main() {
  return !(boost::this_process::get_id() == std::async(
      std::launch::async, []() noexcept {
        return boost::this_process::get_id();
      }
    ).get());
}

$ c++ -std=c++17 -otest -pthread test.cc -lboost_system && ./test && echo 'X512 некомпетентен'
X512 некомпетентен

anonymous
(31.05.21 12:50:27 MSK)

Ответ на: комментарий от anonymous 31.05.21 12:50:27 MSK

boost::this_process::get_id();

Какие-то тонны обёрток. В список процессов смотреть надо. У каждого потока есть свой PID. Для потока его можно получить через gettid(), эти идентификаторы выделяются из того же пула, что и процессы.

X512 ★★★★★
(31.05.21 12:57:30 MSK)
Последнее исправление: X512 31.05.21 13:02:37 MSK (всего исправлений: 2)

Ответ на: комментарий от X512 31.05.21 12:57:30 MSK

#include <future>
#include <thread>

int main() {
  return !(std::this_thread::get_id() != std::async(
      std::launch::async, []() noexcept {
        return std::this_thread::get_id();
      }
    ).get());
}

$ c++ -std=c++17 -otest -pthread test.cc && ./test && echo 'X512 не отличает PID и TID'
X512 не отличает PID и TID

Ололо.

anonymous
(31.05.21 13:03:02 MSK)

Мне после чтения того толстого sysdev мануала по 386 всегда непонятно было, чо все так носятся с созданием процесса. Ну выделил страниц, скопировал/расшарил pic-дллов туда с диска или уже готовых, стек сегмент указал и погнали. Кроме неминуемых затрат цпу особо ничего делать не надо. И если надо процессу передать дохрена всего, можно в родителе выделить страниц, записать туда данные, а потом отчуждить их в пользу чилда, а там уж он решит их судьбу. А то придумали херни, засунь все через дырку exec(argv), то ли код дескриптора туда, то ли имя файла. Самые стремные интерфейсы это когда надо что-то сериализовывать через замочную скважину.

Мне кажется эти все проблемы и стенания (в линуксе форк хармфул, в винде createprocess soooo slow) от изначально кривой архитектуры. Процесс это tss, stack и немного структур в «ядре» (да, я в курсе, что хардваре тсс сейчас не юзают, но суть одна). Это вообще одна из самых простых вещей, по сравнению с сокетами или девайсами.

В чем я ошибаюсь?

anonymous
(31.05.21 13:03:11 MSK)

Ссылка

Ответ на: комментарий от anonymous 31.05.21 13:03:02 MSK

X512 не отличает PID и TID

Технически это одно и тоже, но местами различается, например getpid(), gettid().

X512 ★★★★★
(31.05.21 13:05:21 MSK)

Ответ на: комментарий от anonymous 31.05.21 13:03:02 MSK

!(... != ...)

Зачем так делать?

Tanger ★★★★★
(31.05.21 13:06:31 MSK)

Ответ на: комментарий от X512 31.05.21 13:05:21 MSK

Технически это одно и тоже, но местами различается,

фейспалм.жопг

anonymous
(31.05.21 13:07:03 MSK)

Ответ на: комментарий от anonymous 31.05.21 13:07:03 MSK

https://stackoverflow.com/a/8787888

But as it happens, the kernel doesn’t make a real distinction between them: threads are just like processes but they share some things (memory, fds…) with other instances of the same group.

X512 ★★★★★
(31.05.21 13:08:05 MSK)

Ответ на: комментарий от Tanger 31.05.21 13:06:31 MSK

Навенное делит смысл сравнения и смысл возврата main, в целом неплохая идея

anonymous
(31.05.21 13:08:27 MSK)

Ссылка

Ответ на: комментарий от X512 31.05.21 13:05:21 MSK

Технически это одно и тоже

Как же отчаяно ты пытаешься сохранить лицо. Нет, это явно не одно и то же, что я и продемонстрировал выше.

anonymous
(31.05.21 13:09:32 MSK)

Ссылка

Ответ на: комментарий от X512 31.05.21 13:08:05 MSK

So, a tid is actually the identifier of the schedulable object in the kernel (thread), while the pid is the identifier of the group of schedulable objects that share memory and fds (process).

Тебе разжевать?

anonymous
(31.05.21 13:13:15 MSK)

Ответ на: комментарий от anonymous 31.05.21 13:13:15 MSK

Чо ты доипался до малозначимой херни? Все знают, что треды в линуксе прилеплены сбоку на основе процессов, и пид/тид разница нужна только чтобы их выстроить в иерархию, чтобы стопать и убивать разом. Это как процессгруп, только еще один уровень.

anonymous
(31.05.21 13:17:25 MSK)

Ответ на: комментарий от X512 31.05.21 12:09:48 MSK

Создать недоинициализированный процесс и потом с помощью API его настраивать и инициализировать?

Ну да. Ты же можешь с помощью API, например, приостановить процесс, трассировать системные вызовы, или вообще убить его — почему нельзя запустить его на выполнение?

byko3y ★★★★★
(31.05.21 13:17:27 MSK)

Ответ на: комментарий от byko3y 31.05.21 13:17:27 MSK

почему нельзя запустить его на выполнение?

Почему нельзя? Можно: DWORD ResumeThread(HANDLE hThread);

LamerOk ★★★★★
(31.05.21 13:22:18 MSK) автор топика

Ответ на: комментарий от anonymous 31.05.21 13:17:25 MSK

Все знают, что треды в линуксе прилеплены сбоку на основе процессов

Это дошколятские поверья. Там кто-то написал подобное, имея ввиду полиморфную обработку в ядре, тот же clone. Но дошколята увидели, нихрена не поняли и давай нести шаблонную херню про «нет потоков в линуксе». Уровень.

Там в толксах твоя сосед по парте бегает, meliafaro называется. Вот у того трепла по ходу «биты в линуксе прилеплены сбоку на основе байтов».

anonymous
(31.05.21 13:38:22 MSK)

Ответ на: комментарий от anonymous 31.05.21 13:38:22 MSK

И царь, как обычно, прав.

LamerOk ★★★★★
(31.05.21 13:39:54 MSK) автор топика
Последнее исправление: LamerOk 31.05.21 13:40:07 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от WitcherGeralt 31.05.21 12:24:49 MSK

Где есть?! Как это они, вообще, смогли реализовать?

Если есть сборка мусора, то это значит, что есть блокировки, а они не являются безопасными относительно обработки сигналов, а потому никакой сборщик мусора нельзя использовать в дочернем процессе после форка! Таких сборщиков просто еще не придумали.

Смысл форка в том, чтобы в дочернем процессе настроить каналы, а потом запустить нужный образ в рамках дочернего процесса.

По сути, ни для чего другого форк не годится! А те, кто пытается использовать его не по назначению, например, что-то там пытаться вывести в дочернем процессе по банальному printf, вообще, пытаться залочить тот же мьютекс или разлочить, то те рискуют в самый неожиданный момент получить корку по сегфолту, особенно, под нагрузкой процессора, когда сигналы появляются чаще обычного.

Поэтому не сочиняй, товарищ! Ты просто не в курсе дела.

anonymous
(31.05.21 14:01:27 MSK)

Ответ на: комментарий от anonymous 31.05.21 14:01:27 MSK

https://docs.python.org/3/library/os.html#os.fork

~~WitcherGeralt~~ ★★
(31.05.21 14:04:20 MSK)

Ну да, всё так.

~~hateyoufeel~~ ★★★★★
(31.05.21 14:05:13 MSK)

Ссылка

с неделю максимум, через YC попадалось прекрасное - fork() наоборот :-) то есть объединение пространств двух процессов в один.

Практической пользы не увидел, поэтому подиагонали только и посмотел. И не поставил закладку и теперь фик найти…

если кто ЭТО встретит - киньте тут ссылкой

MKuznetsov ★★★★★
(31.05.21 14:08:49 MSK)

Ссылка

Ответ на: комментарий от WitcherGeralt 31.05.21 14:04:20 MSK

Там же куча предостережений в описании! Если уповать на то, что после форка нигде в дочернем процессе не сработает ни одна блокировка, а пользователь будет достаточно грамотен, чтобы во время загрузить в дочерний процесс новый образ, то может и прокатит. Видишь, как много «если», сколько неуверенности!

Но чем хороши языки тип сишки и плюсов - они гарантируют, что это можно сделать безопасно, если делать аккуратно. А использование форка в каком-то питончике - это хождение по минному полю.

anonymous
(31.05.21 14:09:56 MSK)

Windows sucked for only having exec*() and _spawn*()

RtlCloneUserProcess().

tnodir ★
(31.05.21 14:19:04 MSK)

Ответ на: комментарий от anonymous 31.05.21 14:09:56 MSK

Двойной форк безупречно работает, никаких проблем за лет десять у меня не было. Это я так по классике демона пулял. Там нужно было небольшое количество логики, а шелл я тогда не знал.

~~WitcherGeralt~~ ★★
(31.05.21 14:25:50 MSK)
Последнее исправление: WitcherGeralt 31.05.21 14:26:03 MSK (всего исправлений: 1)

А можно для пролетариев, внятно и ясно, какие конкретные негативные последствия будут от использования fork()?

pathfinder ★★★★
(31.05.21 14:32:10 MSK)

Ответ на: комментарий от tnodir 31.05.21 14:19:04 MSK

потрачено

anonymous
(31.05.21 14:39:51 MSK)

Ссылка

Ответ на: комментарий от WitcherGeralt 31.05.21 14:25:50 MSK

А я видел, как постоянно падал под нагрузкой в корку дочерний процесс, пока не убрали оттуда printfn, вызываемый до загрузки другого образа после форка (printfn использует блокировки). Падал непредсказуемо. Примерно в одном случае из тысяч (!!) запусков, но стабильно каждый день. Нагрузка на многоядерный процессор была примерно 97-98%.

Когда убрали после форка все вызовы, неявляющиеся «безопасными относительно сигналов», то все заработало как часы, без единого падения. Под такой же нагрузкой в течение длительного времени.

Об этом нюансе пишут в книгах по системному программированию (на сишке). Правда, в примерах все равно для демонстрации вызывают printfn после форка, что недопустимо, но, наверное, там специально оговаривается этот момент.

А так, вот что выдает команда man fork на макоси:

[quote] CAVEATS There are limits to what you can do in the child process. To be totally safe you should restrict yourself to only executing async-signal safe operations until such time as one of the exec functions is called. All APIs, including global data symbols, in any framework or library should be assumed to be unsafe after a fork() unless explicitly documented to be safe or async-signal safe. If you need to use these frameworks in the child process, you must exec. In this situation it is reasonable to exec yourself. [/quote]

Короче, тебе просто пока везет.

anonymous
(31.05.21 15:45:01 MSK)

Ответ на: комментарий от anonymous 31.05.21 15:45:01 MSK

Обрати внимание на то, что я сказал «двойной форк». Это важно. Демонов пускают именно так.

~~WitcherGeralt~~ ★★
(31.05.21 17:42:08 MSK)

Читаешь, порой, такие топики, и чувствуешь себя полным идиотом. :)

ЗЫ Так много умных людей… Почему же хороших продуктов так мало? :)

~~Oleg_Iu~~ ★
(31.05.21 17:45:13 MSK)

Ответ на: комментарий от Oleg_Iu 31.05.21 17:45:13 MSK

Почему же хороших продуктов так мало? :)

Там работать надо

anonymous
(31.05.21 18:54:32 MSK)

Ссылка

Никогда не использую fork и вообще эту модель, горжусь собой, всё правильно делал

I-Love-Microsoft ★★★★★
(31.05.21 20:25:11 MSK)

Ссылка

Ответ на: комментарий от WitcherGeralt 31.05.21 17:42:08 MSK

что дает двойной форк?

~~interrupted~~ ★
(31.05.21 20:33:46 MSK)

Ответ на: комментарий от interrupted 31.05.21 20:33:46 MSK

что дает двойной форк?

отвязывает новый процесс от старого

Керриска почитай, если интересно

anonymous
(31.05.21 20:58:42 MSK)

Ссылка

Ответ на: комментарий от LamerOk 31.05.21 13:22:18 MSK

Почему нельзя? Можно: DWORD ResumeThread(HANDLE hThread);

Это же оффтоп. Отправка сигналов потокам есть только в лине, и то не для всех сигналов. Мы как бы снова возвращаемся к тому, что в никса понятия «поток» изначально вообще не существовало, поток и процесс были одним и тем же, потому понятия «создать поток», «остановить поток» в принципе отсутствовали.

byko3y ★★★★★
(31.05.21 22:06:52 MSK)

Ответ на: комментарий от byko3y 31.05.21 22:06:52 MSK

Это же оффтоп.

Ничего это не «оффтоп», а вполне легальный способ запустить поток на исполнение в другом процессе.

Отправка сигналов потокам есть только в лине, и то не для всех сигналов.

Ты определись, про что ты, - про межпроцессное взаимодействие с потоками или про юниксовые сигналы (которые тут вообще не в тему).

в никса понятия «поток» изначально вообще не существовало

Всё верно, и для это есть отдельная библиотека pthreads, в рамках которой есть все эти pthread_create, pthread_cancel, pthread_kill.

LamerOk ★★★★★
(31.05.21 22:31:34 MSK) автор топика

Ответ на: комментарий от LamerOk 31.05.21 22:31:34 MSK

Ты определись, про что ты, - про межпроцессное взаимодействие с потоками или про юниксовые сигналы (которые тут вообще не в тему)
Всё верно, и для это есть отдельная библиотека pthreads, в рамках которой есть все эти pthread_create, pthread_cancel, pthread_kill

А как по-твоему реализованы pthread_cancel/pthread_kill? Через D-Bus?

byko3y ★★★★★
(01.06.21 02:28:15 MSK)

Судя по всему, автор из «форк толстых программ есть плохо» делает вывод «форк есть плохо». Очевидно же, что не так.

DonkeyHot ★★★★★
(01.06.21 07:31:50 MSK)

Ответ на: комментарий от DonkeyHot 01.06.21 07:31:50 MSK

форк толстых программ

будто в 2021 бывают другие

anonymous
(01.06.21 07:49:31 MSK)

Ссылка

Ответ на: комментарий от X512 31.05.21 13:08:05 MSK

вообще-то даже процессы могут шарить адресное пространство. если уж на то пошло.

так что разницы в линуксе по факту нет.

salozar
(01.06.21 09:20:03 MSK)

Ссылка

Ответ на: комментарий от pathfinder 31.05.21 14:32:10 MSK

Негативные последствия получаются, когда делаешь форк из потока многопоточного процесса. Так как в момент форка в оригинальном процессе исполняется несколько потоков, щелкающих мьютексами, в копии этого процесса эти мьютексы оказываются в непредсказуемом состоянии. Поэтому в чайлде после форка нельзя вызывать библиотечные функции, они непредсказуемо виснут на мьютексах. Например, malloc нельзя, localtime нельзя, stdio нельзя, и т.д. Переинициализировать все библиотечные мьютексы тоже невозможно, они не публичны. Все что можно, по сути, это системными вызовами setgid, setuid, dup, и т.п. подготовить среду исполнения и загрузить в процесс новый образ execve.

iliyap ★★★★★
(01.06.21 09:21:07 MSK)

Ответ на: комментарий от byko3y 01.06.21 02:28:15 MSK

А как по-твоему реализованы

Это не важно. Важно, что их работа гарантируется только внутри процесса.

LamerOk ★★★★★
(01.06.21 09:21:58 MSK) автор топика

Ссылка

Ответ на: комментарий от X512 31.05.21 12:09:48 MSK

Линуксе вообще потоков нет, это процессы с общим адресным пространством, что задаётся флагом системного вызова clone.

Вообще-то в линуксе нет процесов, а как раз есть только треды с разными атрибутами, которые позволяют обозвать некоторые треды «процессом»...

Jetty ★★★★★
(01.06.21 09:55:21 MSK)

Похожие темы