LINUX.ORG.RU
ФорумAdmin

Утекает память в ядре

 , ,


0

6

Привет!

На нескольких машинах с hadoop datanode под ubuntu 14.04 постепенно утекает память (со скоростью ~гигабайт в 3-5 дней, судя по графику равномерно, без скачков). Сумма rss всех процессов значительно, меньше чем поле used в выводе free с учётом буфферов и кеша. Вот содержимое /proc/meminfo после остановки всех лишних процессов и сброса кеша fs:

MemTotal:       12304532 kB
MemFree:         6095396 kB
Buffers:            3016 kB
Cached:            22232 kB
SwapCached:            0 kB
Active:            77920 kB
Inactive:         202592 kB
Active(anon):      61800 kB
Inactive(anon):   193896 kB
Active(file):      16120 kB
Inactive(file):     8696 kB
Unevictable:           0 kB
Mlocked:               0 kB
SwapTotal:      12580860 kB
SwapFree:       12580860 kB
Dirty:                24 kB
Writeback:             0 kB
AnonPages:        254908 kB
Mapped:            20664 kB
Shmem:               552 kB
Slab:              59080 kB
SReclaimable:      29820 kB
SUnreclaim:        29260 kB
KernelStack:        1656 kB
PageTables:         3736 kB
NFS_Unstable:          0 kB
Bounce:                0 kB
WritebackTmp:          0 kB
CommitLimit:    18733124 kB
Committed_AS:     306980 kB
VmallocTotal:   34359738367 kB
VmallocUsed:       41192 kB
VmallocChunk:   34359673284 kB
HardwareCorrupted:     0 kB
AnonHugePages:     24576 kB
HugePages_Total:       0
HugePages_Free:        0
HugePages_Rsvd:        0
HugePages_Surp:        0
Hugepagesize:       2048 kB
DirectMap4k:       50560 kB
DirectMap2M:    12531712 kB

Здесь видно, что MemFree составляет всего лишь половину от MemTotal, хотя даже количество виртуальной памяти выданной процессам всего лишь 300MB. В slabtop ничего прожорливого тоже нет. Пробовал kmemleak, он ничего не поймал за трое суток, хотя память всё так же течёт.

Ядро стандартное, одинаковое поведение на 3.13.0-24-generic и 3.13.0-106-generic

Куда еще можно посмотреть, чтобы выявить чем это вызвано?

А чем эти ноды отличаются от остальных? Если развернуть точно такую же ноду рядом, то утечки тоже проявляются? Что в dmesg, кстати, ничего подозрительного?

Это еще может быть ядерная malware кривая.

Deleted ()

Сумма rss всех процессов значительно, меньше чем поле used в выводе free с учётом буфферов и кеша.

Ни о чём не говорит вообще.

С чего ты взял, что у тебя там что-то «течёт»? Есть какие-то симптомы кроме вывода free и meminfo?

anonymous ()
Ответ на: комментарий от Deleted

Да, эта часть машин ставилась в одно время, похоже все они текут, но с разной скоростью, где-то 2 гигабайта в месяц, на самых подверженых до 5. Есть часть машин с теми же приложениями, которые устанавливали раньше, на них проблема незаметна. Конфигурировались примерно так же. В dmesg после минуты после загрузки только пара обычных записей «perf samples too long»

disarmer ★★★ ()
Ответ на: комментарий от blind_oracle

Сейчас единица по дефолту, вряд ли 0 что-то изменит, нет же памяти свободной

disarmer ★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.