LINUX.ORG.RU
ФорумAdmin

NFS подвисает, растет LoadAverage

 ,


0

1

Здравствуйте. Столкнулся со странным поведением NFSv3 (Centos 6). Папка подключена к клиентской машине, копируем большой блок данных (более 200 Гб). Может копироваться нормально, но может резко возрасти Load Average (раза в 4-5), при этом ЦП ядра не заняты и почти нулевая активность. Тестами удалось понять, что NFS демоны впадают в D-state, вся система подвисает. В логах клиента:

nfs: server 192.168.21.24 not responding, still trying
nfs: server 192.168.21.24 not responding, still trying
nfs: server 192.168.21.24 not responding, still trying

Потом через некоторое время ОК. Очень похоже на то, что было у товарища: Проблема с NFS

В чем может быть дело?

Спасибо


Ответ на: комментарий от Anoxemian

Аппаратный Raid6 на HDD, затем LVM: PV->VG->LV и XFS в итоге. Странно, что простое копирование между папками не вызывает проблем, даже SCP справляется. Висит именно NFS.

netvis
() автор топика

Он же тебе пишет - nfs-сервер не отвечает, что тут непонятного? А load average растёт потому что каждый тред, который ждёт зависший nfs, добавляет в него единицу.

Соответственно смотри что на сервере с io.

firkax ★★★★★
()
Последнее исправление: firkax (всего исправлений: 2)

Четко сказано, что сервер не отвечает.

Очень давно были такие проблемы. Проблемы аппаратного плана - кривое железо и хреновые провода.

На старом железе иногда были проблемы из-за offload. Нужно было его отключать.

Посмотри dmesg с обоих сторон и статистику сетевых адаптеров, если она есть (ethtool -S).

vel ★★★★★
()
Ответ на: комментарий от anonymous2

Проверил еще раз, ждал проблему пару дней. Сегодня вот снова - распаковывал файл на NFS шару с локального диска, не USB. Начались тормоза. 8 стандартных потоков nfsd на сервере, не видно что они прям все используются. Клиент все также жалуется на отвал сервера nfs, но тот доступен по ping. CPU не растет, память не используется особо, IO тоже. Много процессов nfsd в D состоянии (по htop), но не все. LoadAverage возрос с 0.8 до 24-29 сразу на сервере. Что такое - непонятно. Иногда случается, иногда все нормально.

netvis
() автор топика