LINUX.ORG.RU

kernel oops при попытке доступа к смонтированному iso


0

0

Какая-то чертовщина происходит. Пробовал на 2 различных системах с одинаковым дистром (Debian Squeeze).

hostname:~# mount -t iso9660 -o loop,ro debian-506-amd64-CD-1.iso /mnt
hostname:~# ls -la /mnt
Убито
hostname:~#
Message from syslogd@hostname at Nov  3 19:41:42 ...
 kernel:[1824509.794966] Oops: 0000 [#1] SMP

Message from syslogd@hostname at Nov  3 19:41:42 ...
 kernel:[1824509.794990] last sysfs file: /sys/module/nls_base/initstate

Message from syslogd@hostname at Nov  3 19:41:42 ...
 kernel:[1824509.795557] Process ls (pid: 751, ti=f5446000 task=c2bcd940 task.ti=f5446000)

Message from syslogd@hostname at Nov  3 19:41:42 ...
 kernel:[1824509.795598] Stack:

Message from syslogd@hostname at Nov  3 19:41:42 ...
 kernel:[1824509.795775] Call Trace:

Message from syslogd@hostname at Nov  3 19:41:42 ...
 kernel:[1824509.796388] Code: c6 20 00 00 00 74 0f 89 e8 b9 02 00 00 00 99 f7 f9 89 04 24 29 c5 83 e6 10 74 0c 89 e8 be 04 00 00 00 99 f7 fe 29 c5 8b 44 24 24 <8b> 4c 83 0c 8d 44 0d 00 39 44 24 04 76 29 8b 74 24 04 31 d2 eb

Message from syslogd@hostname at Nov  3 19:41:42 ...
 kernel:[1824509.796554] EIP: [<c108986d>] zone_watermark_ok+0x5c/0x9d SS:ESP 0068:f5447cf8

Message from syslogd@hostname at Nov  3 19:41:42 ...
 kernel:[1824509.796597] CR2: 0000000006efb04b

Ответ на: комментарий от post-factum
[2239303.482563] ISO 9660 Extensions: Microsoft Joliet Level 3
[2239303.547210] ISO 9660 Extensions: RRIP_1991A
[2239305.780539] BUG: unable to handle kernel paging request at 06efb04b
[2239305.780579] IP: [<c108986d>] zone_watermark_ok+0x5c/0x9d
[2239305.780615] *pde = 00000000
[2239305.780639] Oops: 0000 [#1] SMP
[2239305.780663] last sysfs file: /sys/module/nls_base/initstate
[2239305.780689] Modules linked in: nls_utf8 isofs vboxnetadp vboxnetflt vboxdrv xt_state xt_multiport iptable_nat nf_nat nf_conntrack_ipv4 nf_conntrack nf_defrag_ipv4 iptable_filter ip_tables x_tables coretemp loop i915 drm_kms_helper drm i2c_i801 i2c_algo_bit rng_core video i2c_core snd_pcm output evdev snd_timer snd button soundcore serio_raw snd_page_alloc pcspkr psmouse processor ext3 jbd mbcache sd_mod crc_t10dif ata_generic ata_piix uhci_hcd r8169 ehci_hcd thermal libata mii scsi_mod usbcore nls_base thermal_sys [last unloaded: vboxdrv]
[2239305.780968]
[2239305.780990] Pid: 23671, comm: ls Not tainted (2.6.32-5-686 #1)
[2239305.781019] EIP: 0060:[<c108986d>] EFLAGS: 00010246 CPU: 1
[2239305.781045] EIP is at zone_watermark_ok+0x5c/0x9d
[2239305.781069] EAX: d175302f EBX: c11aef83 ECX: 00000000 EDX: 2079c085
[2239305.781095] ESI: 00000000 EDI: 00000000 EBP: 5356c789 ESP: e0b11cf8
[2239305.781123]  DS: 007b ES: 007b FS: 00d8 GS: 00e0 SS: 0068
[2239305.781150] Process ls (pid: 23671, ti=e0b10000 task=f5a6b740 task.ti=e0b10000)
[2239305.781187] Stack:
[2239305.781206]  c24df780 2079c085 c10287fc c14190fc e0b11d68 00000000 000200d0 e0b11ed0
[2239305.781249] <0> c108b374 d175302f 00000041 ffffffff 00000000 c24cf7e4 d175302f 00000000
[2239305.781306] <0> 00000000 000200d0 c13b53ac c24df7d8 00015ab9 00000000 c24df7dc 00015ab9
[2239305.781374] Call Trace:
[2239305.781399]  [<c10287fc>] ? find_busiest_group+0x2e9/0x6e6
[2239305.781428]  [<c108b374>] ? get_page_from_freelist+0xc0/0x3c7
[2239305.781459]  [<c11aef83>] ? pci_hp_diva_setup+0x0/0x6b
[2239305.781486]  [<c108b93c>] ? __alloc_pages_nodemask+0xf3/0x4e0
[2239305.781516]  [<c11aef83>] ? pci_hp_diva_setup+0x0/0x6b
[2239305.781553]  [<c126bde7>] ? schedule+0x7a0/0x7dc
[2239305.781590]  [<c11aef83>] ? pci_hp_diva_setup+0x0/0x6b
[2239305.781631]  [<fb288035>] ? isofs_lookup+0x35/0x3e4 [isofs]
[2239305.781671]  [<c10c0694>] ? d_alloc+0x1b/0x154
[2239305.781711]  [<c10c0799>] ? d_alloc+0x120/0x154
[2239305.781746]  [<c10b92d9>] ? do_lookup+0xa6/0x116
[2239305.781779]  [<c10b9b48>] ? __link_path_walk+0x4b7/0x5de
[2239305.781815]  [<c10b9e25>] ? path_walk+0x4f/0xa3
[2239305.781846]  [<c10bafa1>] ? do_path_lookup+0x1f/0x69
[2239305.781873]  [<c10bc109>] ? user_path_at+0x37/0x5f
[2239305.781900]  [<c101f35d>] ? kunmap_atomic+0x51/0x6d
[2239305.781927]  [<c101f369>] ? kunmap_atomic+0x5d/0x6d
[2239305.781954]  [<c109b766>] ? handle_mm_fault+0x946/0x959
[2239305.781983]  [<c10b599b>] ? vfs_fstatat+0x2a/0x50
[2239305.782010]  [<c10b5a02>] ? vfs_lstat+0x13/0x15
[2239305.782037]  [<c10b5a13>] ? sys_lstat64+0xf/0x23
[2239305.782064]  [<c126ebc0>] ? do_page_fault+0x2f1/0x307
[2239305.782090]  [<c126e8cf>] ? do_page_fault+0x0/0x307
[2239305.782117]  [<c10030fb>] ? sysenter_do_call+0x12/0x28
[2239305.782141] Code: c6 20 00 00 00 74 0f 89 e8 b9 02 00 00 00 99 f7 f9 89 04 24 29 c5 83 e6 10 74 0c 89 e8 be 04 00 00 00 99 f7 fe 29 c5 8b 44 24 24 <8b> 4c 83 0c 8d 44 0d 00 39 44 24 04 76 29 8b 74 24 04 31 d2 eb
[2239305.782375] EIP: [<c108986d>] zone_watermark_ok+0x5c/0x9d SS:ESP 0068:e0b11cf8
[2239305.782420] CR2: 0000000006efb04b
[2239305.782650] ---[ end trace a199cc5cf8d32034 ]---
frozen_twilight ★★
() автор топика
Ответ на: комментарий от Lumi

Образ не битый? Проверь контрольную сумму.

Даже если образ битый - oops'а быть не должно.

Deleted
()
Ответ на: комментарий от frozen_twilight

выглядит как ошибка железа, памяти или процессора, возможно что не очень хорошо собрано ядро непосредственно для вашей железки.

попробуйте проверить память, обновить биос и микрокод процессора (для Intel) ( пакеты microcode.ctl , intel-microcode )

Sylvia ★★★★★
()
Ответ на: комментарий от Sylvia

Ядро самое обычное пакетное, одинаковое на обеих протестированных системах:

2.6.32-5-686 #1 SMP Sat Sep 18 02:14:45 UTC 2010 i686 GNU/Linux
Системы отличаются только железом.

frozen_twilight ★★
() автор топика
Ответ на: комментарий от frozen_twilight

если стоят разные модули памяти в разных банках, попробуйте покрутить опции биос в плане частоты работы памяти (снизить по возможности) и RAS to CAS delay (увеличить)

Sylvia ★★★★★
()
Ответ на: комментарий от Sylvia

Всё бы ничего, только это - серверы в зарубежных ДЦ. :)
Думаю, если б проблема была в железе - она дала бы о себе знать уже не раз, поскольку серверы эксплуатируются довольно давно и активно.

frozen_twilight ★★
() автор топика
Ответ на: комментарий от frozen_twilight

ну тогда workaround ) если проблема лезет только при монтировании iso9660 через loop,
то попробуйте fuseiso

Sylvia ★★★★★
()

>[2239305.781631] [<fb288035>] ? isofs_lookup+0x35/0x3e4 [isofs]

Господа, кто-то может это объяснить? В режиме ядра виртуальные адреса всех функций на i386 должны быть 0xc0000000-0xcfffffff. Есть некоторые исключения, но это явно не из них.

Chumka ★★★
()
Ответ на: комментарий от frozen_twilight

> Всё бы ничего, только это - серверы в зарубежных ДЦ. :)
Обратитесь в техподдержку датацентра.

Lumi ★★★★★
()

BUG: unable to handle kernel paging request at 06efb04b - трабла здесь, ядро полезло по какому-то левому адресу, получился оопс. походу испортился какой-то поинтер.

упало в этой функции: EIP is at zone_watermark_ok+0x5c/0x9d. можно сделать так - найти объектник, в который вкомпилена эта функция, сделать objdump -S file.o > file.txt и посмотреть смерженый сишный код с асмом, чтобы понять где трабла. сама фунцкия занимает в памяти 0x9d байт, по оффсету 0x5c можно вычислить команду на которой упало. Посмотреть по асму какие инструкции были выполнены до, и что в итоге получилось в регисрах.

Если бага повторяется стабильно при этом действии - можно хоть на kernel.org постить или на lkml писать.

понятное дело, что такого треша не должно быть в любом случае, так что в ядре где-то бага, 2.6.32-5-686 - может стоить накатить последний патчик для 2.6.32 - возможно багу уже пофиксили.

repu1sion
()
Ответ на: комментарий от frozen_twilight

Ну загрузись с более старым ядром. Демьяньщиков в багзиллу пинай.

Lumi ★★★★★
()

апгрейднулся до 2.6.32-5-686 #1 SMP Sat Oct 30 22:47:19 UTC 2010 i686 GNU/Linux, специально проверил тот же ISO образ, проблема исчезла

frozen_twilight ★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.