Очень хочется найти приложение под linux, способное отслеживать и корректировать работу других приложений (одного или нескольких) примерно след образом:
1) Отслеживать падения и выкидывать как можно больше информации в момент падения в виде отчёта: корка, дамп последних строк логов, и т.д. - те собирать максимальное кол-во информации, которое может пригодится для поиска ошибок.
2) Отслеживать "статус" выполнения на предмет подозриельного поведения - утечек памяти, потребление CPU, анализ сетевого трафика и т.д.
3) При необходимости выполнять трассировку системных и библиотечных вызовов и т.д
4) При некоторох критичных условиях выполнять перезапуск приложения (например при падении, по интегрируемому ватчдогу, при превышении лимитов на память/CPU и т.д.) опять же с генерацией МАКСИМАЛЬНО подробного отчёта и оповещении администратора о сбоях.
т.е. цель - запускать критичное приложение в некотором окружении которое при необходимости будет его поддерживать в работоспособном состоянии и в тоже время анализировать его поведение.
Есть варианты уже готового софта?