oom killer в systemd

Пажжите, но ведь федоровцы уже собрались включить какой-то другой оом-киллер. У них будет битва?

Deleted
(09.01.20 08:07:38 MSK)

Ответ на: комментарий от Deleted 09.01.20 08:07:38 MSK

У них будет битва?

у киллеров? пустить обоих, посмотреть кто кого? ну неплохо, неплохо.

Rastafarra ★★★★
(09.01.20 08:16:33 MSK)

Ссылка

юзерспей реализация oom killer

Когда я обнаружил, что ядерный не работает, я написал свой юзерспейсный. Неужто они всем фейсбуком не могут написать то, что я сделал за день?

Lordwind ★★★★★
(09.01.20 08:36:46 MSK)

Скажите мне, а в чем проблема настроить ядреный oom killer?

У него довольно странный алгоритм работы, который никто не хочет менять. Да и в случае десктопа лучше бы это отдать в юзерспейс. Тогда можно будет накрутить интерактив или правила какие (типа при любом кипеше киляем браузер)

zloelamo ★★★★
(09.01.20 08:53:38 MSK)

Ответ на: комментарий от Lordwind 09.01.20 08:36:46 MSK

Когда я обнаружил, что ядерный не работает, я написал свой юзерспейсный. Неужто они всем фейсбуком не могут написать то, что я сделал за день?

Да, чувак, ты круче пейспука.

Zhbert ★★★★★
(09.01.20 09:31:39 MSK)

Ссылка

Ответ на: комментарий от zloelamo 09.01.20 08:53:38 MSK

Я сначала киляю телеграм, после него - браузер. Я бы сказал, что наличие запущенного телеграма оставляет возможность жить браузеру.

bender ★★★★★
(09.01.20 10:15:23 MSK)

Ответ на: комментарий от bender 09.01.20 10:15:23 MSK

телеграм

У тебя 1 ГБ оперативы?

Deleted
(09.01.20 10:18:09 MSK)

Ответ на: комментарий от Lordwind 09.01.20 08:36:46 MSK

Когда я обнаружил, что ядерный не работает, я написал свой юзерспейсный

Пакажи. Ядрённый настраивать ненужно? Там не earlyoom, не?

CryNet ★★★★★
(09.01.20 10:21:58 MSK)
Последнее исправление: CryNet 09.01.20 10:23:31 MSK (всего исправлений: 1)

Ответ на: комментарий от CryNet 09.01.20 10:21:58 MSK

Время убивать (комментарий)

думаю демонизировать тоже просто

Lordwind ★★★★★
(09.01.20 10:30:51 MSK)
Последнее исправление: Lordwind 09.01.20 10:40:52 MSK (всего исправлений: 1)

Перечитал свой древний тред Время убивать (комментарий). Ржу.

Кто-то обязательно напишет. И назовет oomd.

alchemist ★ (12.12.16 15:09:59)

Lordwind ★★★★★
(09.01.20 10:35:09 MSK)

Ссылка

В андроиде вроде он хорошо работает

В андроиде тоже юзерспейсный, свой.

ValdikSS ★★★★★
(09.01.20 10:47:59 MSK)

Ответ на: комментарий от Lordwind 09.01.20 10:30:51 MSK

Спасибо

CryNet ★★★★★
(09.01.20 10:55:31 MSK)

Ссылка

Ответ на: комментарий от Deleted 09.01.20 08:07:38 MSK

но ведь федоровцы уже собрались включить какой-то другой оом-киллер. У них будет битва?

Как ты думаешь, где именно Леннарт сказал то что описано в топ-посте?

Когда одни федоровцы что-то собираются делать, то перед тем как делать, они пишут об этом в рассылку, чтобы другие федоровцы могли поучаствовать в обсуждении. Приведённая инфа как раз оттуда.

После обсуждения происходит голосование FESCo по вопросу делать или не делать. И так по каждому сколько-нибудь интересному изменению. Так что это не «битва», а рабочий процесс.

alpha ★★★★★
(09.01.20 11:21:52 MSK)

Ссылка

Оно же на C++. Ленарт перепишет его на православный C for Linus’s sake?

NoNameNoNumber ★
(09.01.20 12:17:34 MSK)

Ссылка

Ответ на: комментарий от Deleted 09.01.20 10:18:09 MSK

8

bender ★★★★★
(09.01.20 12:49:13 MSK)

Ссылка

Ответ на: комментарий от Deleted 09.01.20 08:07:38 MSK

федоровцы уже собрались включить какой-то другой оом-киллер

Да. earlyoom - зрелый, отлично работающий продукт, обеспечивающий корректное завершение процессов через SIGTERM.

У них будет битва?

Лёнин systemd-oomd еще не явился на ринг. Фейсбучный oomd сильно жрет процессор и жестко убивает только целые контрольные группы.

hakavlad ★★★
(09.01.20 13:13:02 MSK)

Ответ на: комментарий от hakavlad 09.01.20 13:13:02 MSK

обеспечивающий корректное завершение процессов через SIGTERM

Кстати вопрос, почему вторым шагом идёт SIGKILL, а не дёргается oom?

Этому есть какие-то технические препятствия?

Хочется чтобы если SIGTERM не помог, то поведение системы было таким же как при kernel oom. Чтобы разные механизмы реакции на oom-события не конфликтовали.

alpha ★★★★★
(09.01.20 14:05:41 MSK)

Ответ на: комментарий от alpha 09.01.20 14:05:41 MSK

Кажется, нет технической возможности дёрнуть OOM-киллер для конкретного процесса.

intelfx ★★★★★
(09.01.20 14:09:53 MSK)

Ответ на: комментарий от intelfx 09.01.20 14:09:53 MSK

oom_score_adj=1000 прописать и дёрнуть. Так можно освободдать память процессов в состоянии D.

hakavlad ★★★
(09.01.20 15:05:37 MSK)

Ссылка

Ответ на: комментарий от alpha 09.01.20 14:05:41 MSK

Кстати вопрос, почему вторым шагом идёт SIGKILL, а не дёргается oom?

ядерный может просто не срабатывать. https://github.com/rfjakob/earlyoom/issues/80

Low memory! mem avail: 380 of 5875 MiB (6) % <= min 10 %, swap free: 0 of 0 MiB (0 %) <= min 10 %
Invoking oom killer: done
Low memory! mem avail: 328 of 5875 MiB (5) % <= min 10 %, swap free: 0 of 0 MiB (0 %) <= min 10 %
Invoking oom killer: done
Low memory! mem avail: 277 of 5875 MiB (4) % <= min 10 %, swap free: 0 of 0 MiB (0 %) <= min 10 %
Invoking oom killer: done
Low memory! mem avail: 238 of 5875 MiB (4) % <= min 10 %, swap free: 0 of 0 MiB (0 %) <= min 10 %
Invoking oom killer: done
Low memory! mem avail: 201 of 5875 MiB (3) % <= min 10 %, swap free: 0 of 0 MiB (0 %) <= min 10 %
Invoking oom killer: done
Low memory! mem avail: 175 of 5875 MiB (2) % <= min 10 %, swap free: 0 of 0 MiB (0 %) <= min 10 %
Invoking oom killer: done

[706742.940955] Purging GPU memory, 1116 pages freed, 13038 pages still pinned.
[706743.032224] sysrq: SysRq : Manual OOM execution
[706743.048960] Purging GPU memory, 1116 pages freed, 13038 pages still pinned.
[706743.132372] sysrq: SysRq : Manual OOM execution
[706743.152946] Purging GPU memory, 1106 pages freed, 13038 pages still pinned.
[706743.232711] sysrq: SysRq : Manual OOM execution
[706743.253046] Purging GPU memory, 1449 pages freed, 13038 pages still pinned.
[706743.333101] sysrq: SysRq : Manual OOM execution
[706743.349036] Purging GPU memory, 1113 pages freed, 13038 pages still pinned.

hakavlad ★★★
(09.01.20 15:07:47 MSK)
Последнее исправление: hakavlad 09.01.20 15:15:24 MSK (всего исправлений: 2)

Ответ на: комментарий от hakavlad 09.01.20 15:07:47 MSK

ядерный может просто не срабатывать.

Плохой аргумент если честно. И в тикете никаких подробностей и анализа. Просто взяли и убрали опцию.

Просто берёт и «не срабатывает»? Если это воспроизводимо и ты считаешь что дело не в твоем коде, а в ядерном, то нужно хоть баг в ядерную багзиллу запостить.

alpha ★★★★★
(09.01.20 15:25:33 MSK)

Ответ на: комментарий от alpha 09.01.20 15:25:33 MSK

Это не баг, это фича. Ядро всеми силами открадывает убийства, стараясь сохранить процессы живыми. Побочный эффект - зависание. Воспроизводится легко.

hakavlad ★★★
(09.01.20 16:32:54 MSK)

Ссылка

Ответ на: комментарий от alpha 09.01.20 15:25:33 MSK

Подробностей более чем достаточно - дёрганье киллера не освобождает память. Какие еще подробности нужны?

hakavlad ★★★
(09.01.20 16:34:02 MSK)

Ответ на: комментарий от hakavlad 09.01.20 16:34:02 MSK

Почему не освобождает.

Потому что так и задумано, или потому что ты не за то и не там дергаешь, или потому что не хватает нужной функциональности чтобы дергать правильно?

Тебе надо дернуть не ту логику OOM Killer, где он решает стоит ли вообще кого-то убивать или нет, а именно реализацию, уже после принятия решения. То есть получается что ты дергаешь OOM-ивент парой уровней выше чем нужно.

Это потому что нет нужного API уровнем ниже? Тогда это feature request опять же к ядру.

alpha ★★★★★
(09.01.20 16:40:04 MSK)

Ответ на: комментарий от alpha 09.01.20 16:40:04 MSK

Киллер дёрнуть есть один способ:

echo f > /proc/sysrq-trigger

Этот способ использовался в earlyoom, до сих пор используется в psi-monitor и low-memory-monitor. Другие способы неизвестны.

И этот способ сначала имеет такой эффект: Purging GPU memory. Убийство происходит только при быстром многократном дёргании.

Тогда это feature request опять же к ядру.

К чёрту ядро и его дубовые настройки. Юзерспейс позволяет действовать быстро и аккуратно.

hakavlad ★★★
(09.01.20 16:59:27 MSK)

Ответ на: комментарий от alpha 09.01.20 16:40:04 MSK

Взваливание всего на ядро - отвратительная догма. ООМ киллер должен быть гибридным: ядерный защищает ядро, а юзерспейсная часть заботится об отзывчивости юзерспейса.

hakavlad ★★★
(09.01.20 17:01:12 MSK)
Последнее исправление: hakavlad 09.01.20 17:01:38 MSK (всего исправлений: 1)

Ответ на: комментарий от hakavlad 09.01.20 17:01:12 MSK

Взваливание всего на ядро - отвратительная догма.

Я совсем не про это писала. Как раз наоборот, я говорю о том что логику принятия решения стоит вынести, но при этом механизм реализации оставить одинаковым, чтобы было консистентное поведение во время убийста процесса, вне зависимости от того кто и почему принял решение его убить.

ООМ киллер должен быть гибридным: ядерный защищает ядро, а юзерспейсная часть заботится об отзывчивости юзерспейса.

Чтобы делать гибридные механизмы надо начать с того что перестать посылать друг друга к черту и начать писать дизайн-спеки и feature-request-ы которые эту гбридность будут обеспечивать.

Пока что получается не гибрид, а совершенно не связанные друг с другом реализации, без совместного плана на будущее.

Для автора systemd-юнита для какого-либо приложения например сейчас надо придумывать два механизма: первый - настройки OOMPolicy и cgroups-scope, чтобы настроить OOM Killer с точки зрения ядра, и второй - какая-то магия с KillMode и прочими костылями для реакции на сигналы от earlyoom.

При этом если по OOM Killer хотя бы понятно что это OOM Killer, и для него можно настроить какое-то специальное поведение, то earlyoom маскируется и прячется от systemd. То есть разделить нормальную остановку приложения по запросу пользователя выполненную через systemctl и остановку по early-OOM на практике нельзя.

alpha ★★★★★
(09.01.20 17:30:35 MSK)

Ответ на: комментарий от ValdikSS 09.01.20 10:47:59 MSK

В андроиде тоже юзерспейсный, свой.

Понял, спасибо. Андроид еще большее говно чем я думал, раз люди доустанавливают с плеймаркета дополнительные юзерспейсные тасккиллеры в добавок к имеющемуся

~~SR_team~~ ★★★★★
(09.01.20 18:02:52 MSK) автор топика

Ответ на: комментарий от hakavlad 09.01.20 16:59:27 MSK

Purging GPU memory

На кой черт он вообще к GPU лезет, если закончилась RAM?

~~SR_team~~ ★★★★★
(09.01.20 18:07:42 MSK) автор топика
Последнее исправление: SR_team 09.01.20 18:07:48 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от SR_team 09.01.20 18:02:52 MSK

люди доустанавливают

Он из коробки идет, это системное.

hakavlad ★★★
(09.01.20 18:24:30 MSK)

Ответ на: комментарий от hakavlad 09.01.20 18:24:30 MSK

Я про всякие оптимизаторы, которые убивают фоновые процессы, типа CCleaner

~~SR_team~~ ★★★★★
(09.01.20 18:28:15 MSK) автор топика

Скажите мне, а в чем проблема настроить ядреный oom killer?

В том что его нельзя настроить на раннее реагирование. Ядерные ребята не дали ключей для этого.

В андроиде вроде он хорошо работает

В андроиде хорошо работает юзерспейсный киллер.

hakavlad ★★★
(09.01.20 18:33:06 MSK)

Ссылка

Ответ на: комментарий от alpha 09.01.20 17:30:35 MSK

Пока что получается не гибрид, а совершенно не связанные друг с другом реализации, без совместного плана на будущее.

Всё так. Красиво пишешь. Это уже обсуждается, несовместимость критикуется. Добро пожаловать сюда https://pagure.io/fedora-workstation/issue/98 и возможно сюда https://lists.fedoraproject.org/archives/list/devel@lists.fedoraproject.org/thread/YXDODS3G4YCS7MT4J2QJMJ7EXCVR7NQ2/#W73ZVOIRNNW4YVQT6FNSLI6GHUJCZSKY

hakavlad ★★★
(09.01.20 19:03:21 MSK)

Ссылка

Ответ на: комментарий от SR_team 09.01.20 18:28:15 MSK

а это и есть «победить на десктопе».

~~crypt~~ ★★★★★
(09.01.20 20:16:39 MSK)

Ссылка

Ответ на: комментарий от Deleted 09.01.20 08:07:38 MSK

Пажжите, но ведь федоровцы уже собрались включить какой-то другой оом-киллер. У них будет битва?

И как ты это себе представляешь? Поттер просто сказал: мне больше нравится от фейсбука и плевать.

Как обычно.

~~crypt~~ ★★★★★
(09.01.20 20:23:22 MSK)
Последнее исправление: crypt 09.01.20 20:25:28 MSK (всего исправлений: 1)

Ответ на: комментарий от crypt 09.01.20 20:23:22 MSK

Этот выбор выглядит прагматичным, очевидно, что реализация на C++ может быть более эффективной, чем на питоне

~~SR_team~~ ★★★★★
(09.01.20 21:41:50 MSK) автор топика

Ответ на: комментарий от SR_team 09.01.20 21:41:50 MSK

по-моему на опеннете кто-то из анонимов уже ошибочно писал про earlyoom и python. какая-то новая байка что ли.

~~crypt~~ ★★★★★
(09.01.20 23:42:58 MSK)

Ждём юзерспейсный malloc.

Shadow ★★★★★
(10.01.20 00:00:10 MSK)

Ответ на: комментарий от Shadow 10.01.20 00:00:10 MSK

сборщик мусора что ли? Ну так есть jmalloc, glibc

~~SR_team~~ ★★★★★
(10.01.20 08:12:36 MSK) автор топика

Ответ на: комментарий от SR_team 10.01.20 08:12:36 MSK

VM же!
(если что - это был сарказм)

Shadow ★★★★★
(10.01.20 08:22:16 MSK)

Ссылка

Ответ на: комментарий от crypt 09.01.20 23:42:58 MSK

про earlyoom и python. какая-то новая байка что ли.

nohang на питоне. Реализация на питоне позволила впилить больше фич за приемлемое время. https://github.com/hakavlad/nohang#some-features

hakavlad ★★★
(10.01.20 12:58:48 MSK)

Ответ на: комментарий от hakavlad 10.01.20 12:58:48 MSK

лады, хотя по-моему ТС что-то там перепутал в связи с поттером. я правильно понимаю, что принцип работы каждого из них сводится к мониторингу ресурсов и принятию решений по правилам? тогда в чем смысл интеграции их с systemd? а если они все-таки с чем-то интегрируются, означает ли это, что у них есть какой-то api?

~~crypt~~ ★★★★★
(10.01.20 15:56:56 MSK)
Последнее исправление: crypt 10.01.20 15:57:36 MSK (всего исправлений: 1)

Ответ на: комментарий от crypt 10.01.20 15:56:56 MSK

ТС что-то там перепутал в связи с поттером

Нет.

https://lists.fedoraproject.org/archives/list/devel@lists.fedoraproject.org/message/W73ZVOIRNNW4YVQT6FNSLI6GHUJCZSKY/

https://lists.fedoraproject.org/archives/list/devel@lists.fedoraproject.org/message/N373T3M2IWMMI46YX7Z7UMPKKSAZZRTC/

Хочется отметить, что Леннарт слегка не в теме и довольно дерзок.

принцип работы каждого из них сводится к мониторингу ресурсов и принятию решений по правилам?

Да.

тогда в чем смысл интеграции их с systemd?

В том же, в чем и смысл интеграции всего остального - systemd должен быть всепоглощающим и содержать в себе всё.

Я не знаю, как эта интеграция будет выглядеть на практике. Как минимум, появятся дополнительные настройки в юнитах, позволяющие убивать или перезапускать сервис с демоном, если давление памяти превышает заданное значение.

hakavlad ★★★
(10.01.20 17:45:07 MSK)
Последнее исправление: hakavlad 10.01.20 17:46:42 MSK (всего исправлений: 3)

Ответ на: комментарий от hakavlad 10.01.20 17:45:07 MSK

Нет

ну как нет. федора включает earlyoom. в этом смысле поттеринг выбирает между c и c++ (дискуссия выше). при чем тут nohang с питоном не понятно.

дополнительные настройки в юнитах

список правил должен быть в конфигурации демона. я никак что-то не пойму, в каком случае init-фрейморки должен вмешиваться. а если и собирается, то почему бы earlyoom и facebook-oom не сделать общий api по шине, чтобы они были заменяемы.

~~crypt~~ ★★★★★
(10.01.20 17:55:51 MSK)

Ответ на: комментарий от crypt 10.01.20 17:55:51 MSK

при чем тут nohang с питоном не понятно.

Это я напутал. Сказал, что earlyoom на питоне, тогда как на питоне nohang

~~SR_team~~ ★★★★★
(10.01.20 18:10:54 MSK) автор топика

Ответ на: комментарий от SR_team 10.01.20 18:10:54 MSK

угу. все ок.

~~crypt~~ ★★★★★
(10.01.20 18:22:07 MSK)

Ссылка

Ответ на: комментарий от crypt 10.01.20 17:55:51 MSK

почему бы earlyoom и facebook-oom не сделать общий api по шине, чтобы они были заменяемы

oomd - развивающийся жирный серверный монстр.

earlyoom - простой, зрелый, легкий демон, не собирающийся меняться.

Они совершенно разные. О каком общем api может идти речь?

hakavlad ★★★
(10.01.20 18:27:28 MSK)

Ответ на: комментарий от hakavlad 10.01.20 18:27:28 MSK

oomd - развивающийся жирный серверный монстр.

отлично впишется парой к systemd

earlyoom - простой

а как сейчас в федоре объединяют earlyoom и systemd?

~~crypt~~ ★★★★★
(10.01.20 18:34:05 MSK)

Ответ на: комментарий от crypt 10.01.20 18:34:05 MSK

а как сейчас в федоре объединяют earlyoom и systemd?

Никак. earlyoom критикуется за то, что не поддерживает групповые убийства контрольных групп, предоставляемые юнитной опцией OOMPolicy=kill.

«If set to kill and one of the service’s processes is killed by the OOM killer the kernel is instructed to kill all remaining processes of the service, too.»

hakavlad ★★★
(10.01.20 18:41:02 MSK)

Ответ на: комментарий от hakavlad 10.01.20 18:41:02 MSK

А вот теперь все ясно. Больше у меня нет вопросов

~~SR_team~~ ★★★★★
(10.01.20 20:13:06 MSK) автор топика

Ссылка

Похожие темы