LINUX.ORG.RU
ФорумAdmin

NETBOOT + mount -t nfs /


0

0

Такая вот фигня получилась...
Хотели запустить кучу VPN-серверов без хардов чтоб они грузились по сети с центральной машины...
Но вот что-то они стали падать...
Примерно раз в сутки 1-2 машины падают...
Иногда kernel panic, иногда ppp-процесс начинает жрать ресурсы
и больше никто не может подцепиться, иногда после "loading radius.so" пишет что pppd отсегфолтился...

Монтировалось всё вот так:
mount -t nfs $SERVIP:/var/lib/lessdisks/$IP/var /mnt/var -o nolock

Подскажите куда копать...
кроме как поставить харды обратно...

★★★

Ответ на: комментарий от mezantrop

фишка в том что логов нету...
по крайней мере вразумительных...

http://www.vcity.ru/temp/PIC_0073.JPG
вот собственно подохшее ядро...

Вот кусок лога при подыхании pppd:
May 17 18:20:08 vpn-3 pppd[3245]: Connect: ppp79 <--> /dev/pts/79
May 17 18:20:11 vpn-3 pptpd[3244]: CTRL: Ignored a SET LINK INFO packet with real ACCMs!
May 17 18:20:11 vpn-3 pppd[3245]: MPPE 128-bit stateless compression enabled
May 17 18:20:12 vpn-3 pppd[3245]: Cannot determine ethernet address for proxy ARP
May 17 18:20:12 vpn-3 pppd[3245]: local IP address 172.16.205.80
May 17 18:20:12 vpn-3 pppd[3245]: remote IP address 172.16.10.138
May 17 18:20:17 vpn-3 pppd[3245]: LCP terminated by peer (aM-`^BM-b^@<M-Mt^@^@^@^@)
May 17 18:20:17 vpn-3 pppd[3245]: Connect time 0.1 minutes.
May 17 18:20:17 vpn-3 pppd[3245]: Sent 0 bytes, received 1312 bytes.
May 17 18:20:20 vpn-3 pppd[3245]: Connection terminated.
May 17 18:20:20 vpn-3 pppd[3245]: Modem hangup
May 17 18:20:20 vpn-3 pppd[3245]: Exit.
May 17 18:20:20 vpn-3 pptpd[3244]: GRE: read(fd=6,buffer=508a60,len=8196) from PTY failed: status = -1 error =
Input/output error, usually caused by unexpected termination of pppd, check option syntax and pppd logs
May 17 18:20:20 vpn-3 pptpd[3244]: CTRL: PTY read or GRE write failed (pty,gre)=(6,7)
May 17 18:20:20 vpn-3 pptpd[3244]: CTRL: Reaping child PPP[3245]
May 17 18:20:20 vpn-3 pptpd[3244]: CTRL: Client 192.168.34.179 control connection finished
May 17 18:20:46 vpn-3 pptpd[3342]: CTRL: Client 192.168.34.179 control connection started
May 17 18:20:46 vpn-3 pptpd[3342]: CTRL: Starting call (launching pppd, opening GRE)
May 17 18:20:46 vpn-3 pptpd[3344]: CTRL: Client 192.168.29.107 control connection started
May 17 18:20:46 vpn-3 pptpd[3344]: CTRL: Starting call (launching pppd, opening GRE)
May 17 18:20:46 vpn-3 pppd[3343]: pppd 2.4.4b1 started by root, uid 0
May 17 18:20:56 vpn-3 pptpd[3342]: CTRL: timeout waiting for first packet from our pppd
May 17 18:20:56 vpn-3 pptpd[3344]: CTRL: timeout waiting for first packet from our pppd
May 17 18:21:04 vpn-3 pptpd[3346]: CTRL: Client 192.168.29.107 control connection started
May 17 18:21:04 vpn-3 pptpd[3346]: CTRL: Starting call (launching pppd, opening GRE)
May 17 18:21:13 vpn-3 pptpd[3348]: CTRL: Client 192.168.34.179 control connection started
May 17 18:21:13 vpn-3 pptpd[3348]: CTRL: Starting call (launching pppd, opening GRE)
May 17 18:21:14 vpn-3 pptpd[3346]: CTRL: timeout waiting for first packet from our pppd
May 17 18:21:23 vpn-3 pptpd[3348]: CTRL: timeout waiting for first packet from our pppd
May 17 18:22:05 vpn-3 pptpd[3350]: CTRL: Client 192.168.29.107 control connection started
May 17 18:22:05 vpn-3 pptpd[3350]: CTRL: Starting call (launching pppd, opening GRE)
May 17 18:22:11 vpn-3 pptpd[3352]: CTRL: Client 192.168.34.179 control connection started
May 17 18:22:11 vpn-3 pptpd[3352]: CTRL: Starting call (launching pppd, opening GRE)
May 17 18:22:15 vpn-3 pptpd[3350]: CTRL: timeout waiting for first packet from our pppd
May 17 18:22:15 vpn-3 pptpd[3354]: CTRL: Client 192.168.29.107 control connection started
May 17 18:22:15 vpn-3 pptpd[3354]: CTRL: Starting call (launching pppd, opening GRE)
May 17 18:22:21 vpn-3 pptpd[3352]: CTRL: timeout waiting for first packet from our pppd
May 17 18:22:22 vpn-3 pptpd[3356]: CTRL: Client 192.168.30.70 control connection started
May 17 18:22:22 vpn-3 pptpd[3356]: CTRL: Starting call (launching pppd, opening GRE)



вооще есть подозрение что nfs при большой нагрузке делает что-то типа "disk corruption" и всё перестаёт работать (несмотря на то что / в read-only).

Нагрузка на машины - около 20-30 мегабит полезного трафика + куча процессов в памяти и отжирание ЦПУ (QoS в действии, клиенты шейпятся)...

vahvarh ★★★
() автор топика
Ответ на: комментарий от Mrak

Неее, ppp тут непричём... машина с хардом работает абсолютно нормально...

vahvarh ★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.