LINUX.ORG.RU

Хм... Что за чудо с удалённым сервером??


0

0

top - 23:54:01 up 24 days, 12:03, 12 users,  load average: 30.89, 31.66, 27.11
Tasks: 324 total,   1 running, 323 sleeping,   0 stopped,   0 zombie
Cpu(s):  0.5%us,  1.3%sy,  0.5%ni, 97.0%id,  0.5%wa,  0.0%hi,  0.2%si,  0.0%st
Mem:   2596532k total,  2141112k used,   455420k free,    36896k buffers
Swap:  2008116k total,   575756k used,  1432360k free,   848424k cached

Собственно, всё в топе. Машина вся в idle, при этом LA = 30+.

Висит два неубиваемых /usr/bin/convert

Попытки убивать и разбираться с ситуацией привели к тому, что bash через
ssh не грузится. Коннектится и виснет на входе. Два открытых сеанса тоже
висят. Доступен пока только один ssh-сеанс от юзера.

Есть советы, что делать и кто виноват? :D
★★★★★

Хостингвая машина? Может какой-нить далпайоп-быдлокодер начал конвертить мномегабайтные картинки?

И как это "неубиваемых"? Вообще никак? А если ребутнуть ее?

boombick ★★★★★
()

2 KRoN73.

судя по твоим предыдущим вопросам виноват тот кого ты видишь в зеркале. погугли на тему стена и упругое испарение.

anonymous
()
Ответ на: комментарий от boombick

>Хостингвая машина?

Угум.

>Может какой-нить далпайоп-быдлокодер начал конвертить мномегабайтные картинки?

covert висит мой (автогенерация превьюшек по запросу), и процессор, судя по всему, не жрёт. Места на винтах тоже ещё много, успел заметить, пока шелл не повис.

>И как это "неубиваемых"? Вообще никак?

Да. kill -KILL по id процесс, killall -KILL по имени, pkill -KILL по маске имени - пофиг, ноль эмоций. Хотя буковка "D" в статусе, как понимаю, намекает на то, что процесс об самоубийстве задумался. Но дальше - не хочет.

>А если ребутнуть ее?

Удалённая площадка. Провайдер нажмёт reset, а мне потом опять чекать многогиговые mysql-базы...

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от anonymous

KRoN73 - самый вменяемый человек на этом ресурсе, хоть и раскатал губу. Не быкуй на авторитета.

anonymous
()
Ответ на: комментарий от anonymous

>судя по твоим предыдущим вопросам виноват тот кого ты видишь в зеркале

В зеркале только анонимусы какие-то... Расскажи, как ты такого эффекта на моей машине добился?

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от Deleted

>Если у тебя высокий LA - ищи тормоза в IO.

Так прикол-то в том, что и sy, и wa - около нуля были. Сейчас sy вырос до 10..20%, но wa - по-прежнему около нуля. Кроме того, походу, если машина сама не прочихается, то придётся звонить провайдеру на тему страшной кнопки reset :)

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от KRoN73

sy опять околонулевой. Т.е., таки, машина чем-то там у себя живёт :)

KRoN73 ★★★★★
() автор топика

Блин. А простым юзером - коннектится. Как назло, reboot не прописан в sudoers, блин :)

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от KRoN73

>Хотя буковка "D" в статусе, как понимаю, намекает на то, что процесс об самоубийстве задумался.

Процесс висит на syscall'е. Если syscall завершится, то процессу сразу придет отправленный вами KILL и он завершится. Посмотрите, что написано в demsg (вроде и обычный пользователь может это сделать).

mky ★★★★★
()
Ответ на: комментарий от mky

Чёрт его знает, за какой это период, таймштампов в dmesg нет:

ReiserFS: sda3: warning: vs-8115: get_num_ver: not directory or indirect item
ReiserFS: sda3: warning: vs-8115: get_num_ver: not directory or indirect item
ReiserFS: sda3: warning: vs-8115: get_num_ver: not directory or indirect item
ReiserFS: sda3: warning: vs-8115: get_num_ver: not directory or indirect item
TCP: Treason uncloaked! Peer 80.72.16.89:40948/80 shrinks window 835169621:835169733. Repaired.
TCP: Treason uncloaked! Peer 80.72.16.89:40948/80 shrinks window 835477865:835477977. Repaired.
TCP: Treason uncloaked! Peer 80.72.16.89:40948/80 shrinks window 836081857:836081969. Repaired.
TCP: Treason uncloaked! Peer 80.81.210.254:56321/80 shrinks window 4157759890:4157759891. Repaired.
TCP: Treason uncloaked! Peer 80.81.210.254:56321/80 shrinks window 4157759890:4157759891. Repaired.
TCP: Treason uncloaked! Peer 80.81.210.254:39614/80 shrinks window 4161625862:4161625863. Repaired.
TCP: Treason uncloaked! Peer 80.81.210.254:39614/80 shrinks window 4161625862:4161625863. Repaired.
TCP: Treason uncloaked! Peer 80.81.210.254:35225/80 shrinks window 4154684465:4154684466. Repaired.
TCP: Treason uncloaked! Peer 80.81.210.254:35225/80 shrinks window 4154684465:4154684466. Repaired.
TCP: Treason uncloaked! Peer 80.81.210.254:43766/80 shrinks window 4152189932:4152189933. Repaired.
TCP: Treason uncloaked! Peer 80.81.210.254:42555/80 shrinks window 4157331311:4157331312. Repaired.
ReiserFS: sda3: warning: vs-8115: get_num_ver: not directory or indirect item
ReiserFS: sda3: warning: vs-8115: get_num_ver: not directory or indirect item

===================================================================
BUG: unable to handle kernel NULL pointer dereference at virtual address 00000018
 printing eip:
c019a615
*pde = 00000000
Oops: 0000 [#1]
SMP 
Modules linked in: ipmi_si ipmi_msghandler i2c_dev capability commoncap rtc eeprom adm1021 i2c_i801 i2c_core pcspkr nfs lockd sunrpc sl811_hcd usbhid ohci_hcd uhci_hcd usb_storage ehci_hcd usbcore
CPU:    0
EIP:    0060:[<c019a615>]    Not tainted VLI
EFLAGS: 00210246   (2.6.18-gentoo-r3 #1) 
EIP is at prepare_error_buf+0x250/0x3fd
eax: 00000000   ebx: df9f1b98   ecx: 00000000   edx: fffffff6
esi: c0419eda   edi: c0419add   ebp: df9f1b94   esp: df9f1b1c
ds: 007b   es: 007b   ss: 0068
Process mysqld (pid: 16307, ti=df9f1000 task=c59fcaa0 task.ti=df9f1000)
Stack: 00000000 0000009f 00afeef5 df9f1b98 c0419ed9 00000001 0000004b 00000003 
       0000009f 00afeef5 00000000 00000000 c0419add 00010f7c df9f1b94 df9f1bb0 
       00000000 e3aef344 df9f1e78 f7dfb600 00000400 c999e018 00000001 00000006 
Call Trace:
 [<c019a7d5>] reiserfs_printk+0x13/0x20
 [<c019aa76>] print_block+0x81/0x43e
 [<c01a0a81>] reiserfs_cut_from_item+0x3c7/0x7c4
 [<c019eb2e>] pathrelse+0x18/0x28
 [<c0128199>] autoremove_wake_function+0x0/0x3a
 [<c01a1210>] reiserfs_do_truncate+0x392/0x524
 [<c018e3d5>] reiserfs_truncate_file+0x1a8/0x28f
 [<c0194554>] reiserfs_file_release+0x373/0x393
 [<c015536f>] __fput+0x84/0x136
 [<c0152e01>] filp_close+0x50/0x59
 [<c0153f7c>] sys_close+0x6e/0x82
 [<c0102849>] sysenter_past_esp+0x56/0x79
Code: 0c 8b 55 00 0f b7 42 04 50 ff 32 68 d1 5c 31 c0 ff 74 24 3c e8 94 47 05 00 83 c4 10 e9 05 01 00 00 8d 5d 04 89 5c 24 0c 8b 45 00 <8b> 40 18 0f b7 50 04 0f b7 48 02 0f b7 00 52 51 50 68 ec 5c 31 
EIP: [<c019a615>] prepare_error_buf+0x250/0x3fd SS:ESP 0068:df9f1b1c
 BUG: warning at kernel/exit.c:854/do_exit()
 [<c011a58f>] do_exit+0x3d/0x6fc
 [<c0103c1d>] die+0x21e/0x244
 [<c0110a5f>] do_page_fault+0x3a5/0x472
 [<c01106ba>] do_page_fault+0x0/0x472
 [<c0103431>] error_code+0x39/0x40
 [<c019a615>] prepare_error_buf+0x250/0x3fd
 [<c019a7d5>] reiserfs_printk+0x13/0x20
 [<c019aa76>] print_block+0x81/0x43e
 [<c01a0a81>] reiserfs_cut_from_item+0x3c7/0x7c4
 [<c019eb2e>] pathrelse+0x18/0x28
 [<c0128199>] autoremove_wake_function+0x0/0x3a
 [<c01a1210>] reiserfs_do_truncate+0x392/0x524
 [<c018e3d5>] reiserfs_truncate_file+0x1a8/0x28f
 [<c0194554>] reiserfs_file_release+0x373/0x393
 [<c015536f>] __fput+0x84/0x136
 [<c0152e01>] filp_close+0x50/0x59
 [<c0153f7c>] sys_close+0x6e/0x82
 [<c0102849>] sysenter_past_esp+0x56/0x79

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от KRoN73

Боюсь, что с учетом того что ошибка произошла на mysqld

Process mysqld (pid: 16307

базы придется чекать в любом случае.

mky ★★★★★
()
Ответ на: комментарий от KRoN73

(а рейзер я, кажется, сглазил :) )

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от KRoN73

А если таки поребутить? Послав привет init`у, или каким remote reboot`ом?

Другой вариант, подключиться к KVM Switch ассоциированному вашей машине.

philon
()
Ответ на: комментарий от philon

>А если таки поребутить?

Как? У меня в sudoers только pkill :)

>Другой вариант, подключиться к KVM Switch

Всё равно до утра не могу до техподдержки достучаться. А утром они мне и ресет нажмут, фиг с ними.

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от KRoN73

man init

SIGNALS
SIGINT
Normally the kernel sends this signal to init when CTRL-ALT-DEL is pressed. It activates the ctrlaltdel action.

polachok
()
Ответ на: комментарий от KRoN73

Странно. Не иначе, как диск отвалился, но как же вам тогда там хоть что-то делать удаётся? Какие либо команды, из в памяти не закешированных -- запускаются?

philon
()
Ответ на: комментарий от philon

>Какие либо команды, из в памяти не закешированных -- запускаются?

Да. Только что зашёл оттуда на LOR из lynx. Его - точно с последнего перезапуска машины не запускал :)

...

Но вот "ls /" - повесился. Что странно, учитывая, что /usr/bin - тоже в корневом разделе. У меня только /var, да /home отдельные.

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от KRoN73

ЮНо вот "ls /" - повесился. Что странно, учитывая, что /usr/bin - тоже в корневом разделе. У меня только /var, да /home отдельные.

Это не странно. Началу католога не поплохело, вот и работает. А далее, может и ссылка плохая быть, может не читаться и т.д.

Mishka

anonymous
()

Всё, по ресету - всё перезагрузилось без проблем и даже ничего не грохнулось в БД (вроде, хотя за логами и статусом ещё послежу).

...

Походу, Reiser в 2.6.18 не выдержал работу с mysql? :)

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от KRoN73

> Походу, Reiser в 2.6.18 не выдержал работу с mysql? :)

Либо так, либо кто-то из пользователей пытался получить root'a
через NULL pointer dereference.

blackice
()

Значит так. Такое я видел, если отвалился сервер CIFS на ранних ядрах. Любое обращение к подмонтированному диску отправляло процесс в D и делало его бессмертным. А LA, собственно, просло пропорционально их числу.

Вывод. Где-то, что-то отвалилось и недоступно.

annoynimous ★★★★★
()
Ответ на: комментарий от annoynimous

> Значит так. Такое я видел, если отвалился сервер CIFS на ранних ядрах. Любое обращение к подмонтированному диску отправляло процесс в D и делало его бессмертным. А LA, собственно, просло пропорционально их числу. Вывод. Где-то, что-то отвалилось и недоступно.

Я вижу такое постоянно как запускаю kdetv после чего зависают консоли, ps, ls /proc/$KDETVPID/. D означает Deep Sleep, блокировку в системном вызове. Это проблемы с ядром/драйверами(в моем случае с saa7134), кооторые может вызывать и железо. А глючный рейзер фтопку.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.