LINUX.ORG.RU
ФорумAdmin

Проблемы с работой нфс

 ,


0

2

В общем так, немножко предыстории.
Стояла у меня на школоло-сервере 11.4, крутилось на ней: самба, ежабберд, привокси, сквид, нфс... ну и так, по мелочи. И проблем с этим самым нфс не было. В смысле - СОВСЕМ НЕ БЫЛО.
Но вот срок поддержки 11.4 вроде как закончился, ага. И решил я кардинально обновиццо. Сразу на 12.2. Конфиги забэкапил на другую машину, и установил на этот самый «сервачок» новый дистр. И всё, заверьте...

Теперь по сабжу.
Буквально сразу же начались траблы, и если со всякими невидиями и прочими устройствами оно было ожидаемо, то вот падение нфс было равносильно снегопаду в середине июля.
Суть такова, нфс ВНЕЗАПНО какбэ падает. Почему какбэ? Потому что возможны два варианта.
1. При запросе статуса сервиса нфс выводится, что нфс failed, но всё работает.
2. Внезапно при загрузке/сохранении файлов в нфс-шару всё намертво виснет, по запросу статуса выдаёт фейл, как в п.1
Немножко выхлопа из мессаджесов:

Dec 12 09:19:41 zg153 kernel: [67601.512911] statd: server rpc.statd not responding, timed out
Dec 12 09:19:41 zg153 kernel: [67601.512959] lockd: cannot monitor L9
Dec 12 09:20:16 zg153 kernel: [67636.584149] statd: server rpc.statd not responding, timed out
Dec 12 09:20:16 zg153 kernel: [67636.584193] lockd: cannot monitor z5
Dec 12 09:20:51 zg153 kernel: [67671.655296] statd: server rpc.statd not responding, timed out
Dec 12 09:20:51 zg153 kernel: [67671.655330] lockd: cannot monitor z8
Dec 12 09:21:26 zg153 kernel: [67706.726560] statd: server rpc.statd not responding, timed out
Dec 12 09:21:26 zg153 kernel: [67706.726595] lockd: cannot monitor L9
Dec 12 09:22:01 zg153 kernel: [67741.797742] statd: server rpc.statd not responding, timed out
Dec 12 09:22:01 zg153 kernel: [67741.797793] lockd: cannot monitor z5
Dec 12 09:22:36 zg153 kernel: [67776.868989] statd: server rpc.statd not responding, timed out
Dec 12 09:22:36 zg153 kernel: [67776.869023] lockd: cannot monitor z8
Dec 12 09:23:11 zg153 kernel: [67811.940167] statd: server rpc.statd not responding, timed out
Dec 12 09:23:11 zg153 kernel: [67811.940205] lockd: cannot monitor L9
Dec 12 09:23:46 zg153 kernel: [67847.011349] statd: server rpc.statd not responding, timed out
Dec 12 09:23:46 zg153 kernel: [67847.011384] lockd: cannot monitor z5
Dec 12 09:24:07 zg153 rpc.statd[2099]: process_notify_list: Can't callback zg153 (100021,3), giving up
Dec 12 09:24:21 zg153 kernel: [67882.082597] statd: server rpc.statd not responding, timed out
Dec 12 09:24:21 zg153 kernel: [67882.082637] lockd: cannot monitor z8
Dec 12 09:24:56 zg153 kernel: [67917.153793] statd: server rpc.statd not responding, timed out
Dec 12 09:24:56 zg153 kernel: [67917.153829] lockd: cannot monitor L9
Dec 12 09:25:31 zg153 kernel: [67952.225010] statd: server rpc.statd not responding, timed out
Dec 12 09:25:31 zg153 kernel: [67952.225047] lockd: cannot monitor z5
Dec 12 09:26:06 zg153 kernel: [67987.296208] statd: server rpc.statd not responding, timed out
Dec 12 09:26:06 zg153 kernel: [67987.296244] lockd: cannot monitor sz0
Dec 12 09:26:42 zg153 kernel: [68022.367407] statd: server rpc.statd not responding, timed out
Dec 12 09:26:42 zg153 kernel: [68022.367452] lockd: cannot monitor z8
Dec 12 09:27:17 zg153 kernel: [68057.438629] statd: server rpc.statd not responding, timed out
Dec 12 09:27:17 zg153 kernel: [68057.438659] lockd: cannot monitor L9
Dec 12 09:27:52 zg153 kernel: [68092.509822] statd: server rpc.statd not responding, timed out
Dec 12 09:27:52 zg153 kernel: [68092.509856] lockd: cannot monitor z5
Dec 12 09:28:27 zg153 kernel: [68127.581084] statd: server rpc.statd not responding, timed out
Dec 12 09:28:27 zg153 kernel: [68127.581121] lockd: cannot monitor sz0
Dec 12 09:29:02 zg153 kernel: [68162.652269] statd: server rpc.statd not responding, timed out
Dec 12 09:29:02 zg153 kernel: [68162.652305] lockd: cannot monitor z8
Dec 12 09:29:36 zg153 sm-notify[10677]: Version 1.2.6 starting
Dec 12 09:29:36 zg153 sm-notify[10677]: Already notifying clients; Exiting!
Dec 12 09:29:36 zg153 nfs[10666]: Starting NFS client services: sm-notify idmapd..done
Dec 12 09:29:36 zg153 nfs[10682]: Shutting down NFS client services:umount: /var/lib/nfs/rpc_pipefs: target is busy.
Dec 12 09:29:36 zg153 nfs[10682]: (In some cases useful info about processes that use
Dec 12 09:29:36 zg153 nfs[10682]: the device is found by lsof(8) or fuser(1))
Dec 12 09:29:36 zg153 nfs[10682]: ..failed
Dec 12 09:29:36 zg153 systemd[1]: nfs.service: control process exited, code=exited status=1
Dec 12 09:29:36 zg153 systemd[1]: Unit nfs.service entered failed state.
Dec 12 09:30:12 zg153 kernel: [68232.794683] statd: server rpc.statd not responding, timed out
Dec 12 09:30:12 zg153 kernel: [68232.794716] lockd: cannot monitor z5

Свежачокс, так сказать. Дети открывали свои документы из нфс-шары. 10 клиентов. Каждый запускал свой документ. Всё вывесилось, рестарт службы не дал результатов, как вы видите. Кстати, странный каталог /var/lib/nfs/rpc_pipefs, который обычно занят. Не удаляеццо, кстати.
Далее, ребучу сервер. В мессаджесах насторожило вот это:
Dec 12 09:31:40 zg153 network-remotefs[1625]: Setting up (remotefs) network interfaces:
Dec 12 09:31:40 zg153 rpc.statd[1922]: Failed to open /var/lib/nfs/sm/192.168.0.57: No such file or directory
Dec 12 09:31:40 zg153 rpc.statd[1922]: Failed to stat /var/lib/nfs/sm/192.168.0.53: No such file or directory
Dec 12 09:31:40 zg153 rpc.statd[1922]: Failed to stat /var/lib/nfs/sm/192.168.0.51: No such file or directory
Dec 12 09:31:40 zg153 rpc.statd[1922]: Failed to stat /var/lib/nfs/sm/192.168.0.54: No such file or directory
Dec 12 09:31:40 zg153 rpc.statd[1922]: Failed to stat /var/lib/nfs/sm/192.168.0.55: No such file or directory
Dec 12 09:31:40 zg153 rpc.statd[1922]: Failed to stat /var/lib/nfs/sm/192.168.0.59: No such file or directory
Dec 12 09:31:40 zg153 rpc.statd[1922]: Failed to stat /var/lib/nfs/sm/192.168.0.58: No such file or directory
Dec 12 09:31:40 zg153 kernel: [   26.316307] NFSD: Using /var/lib/nfs/v4recovery as the NFSv4 state recovery directory
Dec 12 09:31:40 zg153 kernel: [   26.328050] NFSD: starting 90-second grace period
Dec 12 09:31:40 zg153 sm-notify[2013]: Version 1.2.6 starting
Dec 12 09:31:40 zg153 sm-notify[2013]: Already notifying clients; Exiting!

Такие вот дела, я вообще не понял, чего ему надо. И куда копать?
Если ещё какой выхлоп надо, то пишите - закину.

★★★

Последнее исправление: cetjs2 (всего исправлений: 1)

Может глупый совет сейчас дам, но почему бы не снести все конфиги нфс, и настроить заново. Там делов на 10 мин.

teisatsu
()

Добавлю. Зависло при сохранении.

Dec 12 13:27:33 zg153 kernel: [14134.590701] statd: server rpc.statd not responding, timed out
Dec 12 13:27:33 zg153 kernel: [14134.590734] lockd: cannot unmonitor z6
Dec 12 13:28:08 zg153 kernel: [14169.552006] statd: server rpc.statd not responding, timed out
Dec 12 13:28:08 zg153 kernel: [14169.552042] lockd: cannot unmonitor l7
Dec 12 13:28:16 zg153 rpc.statd[1922]: Received erroneous SM_UNMON request from zg153 for 192.168.0.56
Dec 12 13:28:43 zg153 kernel: [14204.513232] statd: server rpc.statd not responding, timed out
Dec 12 13:28:43 zg153 kernel: [14204.513269] lockd: cannot unmonitor z8
Dec 12 13:28:57 zg153 rpc.statd[1922]: Received erroneous SM_UNMON request from zg153 for 192.168.0.56
Dec 12 13:29:18 zg153 kernel: [14239.474536] statd: server rpc.statd not responding, timed out
Dec 12 13:29:18 zg153 kernel: [14239.474571] lockd: cannot unmonitor L9
Dec 12 13:29:23 zg153 rpc.statd[1922]: Received erroneous SM_UNMON request from zg153 for 192.168.0.57
Dec 12 13:29:35 zg153 rpc.statd[1922]: Received erroneous SM_UNMON request from zg153 for 192.168.0.57
Dec 12 13:29:53 zg153 kernel: [14274.435742] statd: server rpc.statd not responding, timed out
Dec 12 13:29:53 zg153 kernel: [14274.435776] lockd: cannot unmonitor z10
Dec 12 13:29:57 zg153 su: (to root) vier on /dev/pts/0
Dec 12 13:30:09 zg153 rpc.statd[1922]: Received erroneous SM_UNMON request from zg153 for 192.168.0.58
Dec 12 13:30:20 zg153 rpc.statd[1922]: Received erroneous SM_UNMON request from zg153 for 192.168.0.58
Dec 12 13:30:28 zg153 kernel: [14309.397071] statd: server rpc.statd not responding, timed out
Dec 12 13:30:28 zg153 kernel: [14309.397105] lockd: cannot unmonitor L1
Dec 12 13:30:29 zg153 sm-notify[27865]: Version 1.2.6 starting
Dec 12 13:30:29 zg153 sm-notify[27865]: Already notifying clients; Exiting!
Dec 12 13:30:29 zg153 nfs[27854]: Starting NFS client services: sm-notify idmapd..done
Dec 12 13:30:29 zg153 nfs[27870]: Shutting down NFS client services:umount: /var/lib/nfs/rpc_pipefs: target is busy.
Dec 12 13:30:29 zg153 nfs[27870]: (In some cases useful info about processes that use
Dec 12 13:30:29 zg153 nfs[27870]: the device is found by lsof(8) or fuser(1))
Dec 12 13:30:29 zg153 nfs[27870]: ..failed
Dec 12 13:30:29 zg153 systemd[1]: nfs.service: control process exited, code=exited status=1
Dec 12 13:30:29 zg153 systemd[1]: Unit nfs.service entered failed state.
Dec 12 13:31:03 zg153 kernel: [14344.358338] statd: server rpc.statd not responding, timed out
Dec 12 13:31:03 zg153 kernel: [14344.358373] lockd: cannot unmonitor z2
Dec 12 13:31:08 zg153 rpc.statd[1922]: Received erroneous SM_UNMON request from zg153 for 192.168.0.59
После рестарта выдало, как обычно, фейл, но документы сохранились ок. По факту - нфс какбэ работает, но выхлоп говорит обратное.

Vier_E ★★★
() автор топика
Ответ на: комментарий от Vier_E

portmap?

server rpc.statd not responding, timed out

Судя по всему что-то не так с portmap.

Оно запущено?

invokercd ★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.