LINUX.ORG.RU

Почему top, atop не показывают все процессы, сильно нагружающие CPU

 , ,


0

2

Имеется Debian 9.8 c ядром 4.15.18, установленным вместе с Proxmox 5.3-11. Наблюдаю странные скачки загрузки процессора (Core i7-6700@3.40GHz) каждые 70минут и длится примерно 5 мин. Лучше всего это видно в графике загрузки CPU в Zabbix: http://ipic.su/img/img7/fs/zab.1554026765.png

Если в это время посмотреть вывод uptime или top будет примерно так:

load average: 3.8, 0.37, 0.44
Однако список процессов ни в top: http://ipic.su/img/img7/fs/top.1554027457.jpg

ни в atop -a: http://ipic.su/img/img7/fs/atop.1554027503.jpg

не показывают процесса, который бы почти полностью загружал 4-ре ядра в течение нескольких минут. Как такое может быть и что я упускаю?

LA - это не только загрузка процессора, но и i/o и сети.

Deleted ()

Потому что вероятно искомые процессы «загружают» CPU не работой, а циклами ожидания ввода/вывода, которые разные программы представляют и интерпретируют по разному. Например, top показывает только суммарное время для всех процессов в таком состоянии в поле wa%

Кстати, на это указывает и параметр LA (load average) — это число процессов находящихся в очереди исполнения. Большое значение означает либо много работающих процессов, либо то, что где-то возникло бутылочное горлышко, которое тормозит исполнение. Например, — тадам-с — медленный дисковый ввод-вывод + своппинг.

unanimous ★★★★★ ()
Ответ на: комментарий от Deleted

работаю под root, в /usr/sbin/sa ничего нет. Насколько я понял это утилита redhat. У меня в Debian есть:

apropos sa
sa1 (8)              - Collect and store binary data in the system activity daily data file.
sa2 (8)              - Create a report from the current standard system activity daily data file.
которые установились с пакетом sysstat. Подходит?

kostenelo ()
Ответ на: комментарий от kostenelo

которые установились с пакетом sysstat. Подходит?

Без понятия. Пробуй. У меня sa, я ж написал пакет: acct.

Deleted ()
Ответ на: комментарий от unanimous

Очень логично, но у меня SSD диски, сервер простаивает (разве что Zabbix что-то делает...). По сети почти ничего не передается. top показывает 1.0 wa когда load average: 3.8.

Прикладываю график CPU utilization из Zabbix http://ipic.su/img/img7/fs/ut.1554030315.png

kostenelo ()
Ответ на: комментарий от kostenelo

Я не понимаю, ты показываешь графики загрузки внутри виртуалки или хоста? Что там меряется внутри виртуальной машины я лично плохо себе представляю, возможно там высокий LA из-за гернерации, например, большого количества прерываний, скажем, сетевухой, которые обрабатываются виртуальнойй машиной софтово и грузят ее.

Что тебя вообще волнует? Всё работает и ты просто доискиваешься причины или есть какие-то реальные проблемы?

unanimous ★★★★★ ()

Debian 9.8 c ядром 4.15.18

работаю под root

с ядром как то непонятно? дообновлял бы уже до стока из сидорепы там уже 4.19.0-4 завезли!

amd_amd ★★★★ ()
Ответ на: комментарий от unanimous

Графики хоста визуализации. Соответственно меня интересуют непонятные скачки загрузки этого хоста. Некоторые пользователи виртуальной машины на этом хосте жалуются на лаги при обычной офисной работе. Я пытаюсь найти причину. Саму виртуальную машину пользователей я уже отключил и картина не меняется. Таким образом причина либо на самом хосте, либо в Zabbix сервере, который работает в LXC контейнере на этом хосте и собирает данные о работе этого же хоста + еще 6 систем (2-х хостов и 4 виртуалок). Через 20 мин отключу Zabbix сервер. Он выглядит подозрительно, хотя ему много не надо..

kostenelo ()
Ответ на: комментарий от kostenelo

Методом исключения нашел виновника - это zabbix_server. Если выключить LXC контейнер странные скачки загрузки LA (load average) исчезают. При включении zabbix_server LA периодически подскакивает до 4, этом как на хосте, так и в самом контейнере загрузка CPU не превышает 2%, RAM, swap, диски и сеть практически не используются... Встроенный комплексный экран мониторинга zabbix_server тоже показывает все ок. Склоняюсь к мысли, что LA показывает какую-то абстрактную «загрузку», которая слабо соотносится с реальной имеющейся в наличии производительности. Как вариант попробую запустить sysbench в простое и когда подскакивает LA а потом сравнить

kostenelo ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.