LINUX.ORG.RU

[need help] Странные глюки >=kernel-2.6.31


0

0

Сначала пытался разобраться с проблемой сам, но уже без понятия куда копать, поэтому спрошу здесь.

Странности начались проявляться еще в rc к 2.6.31, система в случайный момент просто висла намертво, либо при загрузке ядра, либо при ините (до рабочего стола доходило в очень редких случаях).

Потом я заметил, что проблема в input-е, т.е. если зажать какую-нибудь клавишу, или двигать точпад, то система отвиснет, и начнет мигать курсором.

Проблемы были и до этого (клавиши как будто западали) помогло добавление к параметрам ядра i8042.reset i8042.nomux.

Я добавил параметры к ядру: i8042.noaux (отключил точпад) и зависания стали реже, но не исчезли.

Если система загрузится, то глюки постепенно добавляются, например через несколько минут после загрузки отваливается сеть и процесс ksoftirqd/0 начинает есть 100% проца, либо так же система висит, пока не начнешь двигать мышью/печатать на клавиатуре. Может вообще выключится ноут. Еще было что система вообще отказывалась загружаться, при загрузке было куча ошибок обращения к диску (хотя на самом деле с ним все ок).

Если система загрузится, то в dmesg ничего не сыплется.

Пробовал ядро ванильное, гентушное, ubuntu-9.10 разные версии, везде зависания или нестабильности...

Подскажите в какую сторону можно копать

З.Ы. Инфо: Ноутбук: Toshiba Satellite A110 lspci

★★★★★

Ответ на: комментарий от Deleted

>С такими проблемами надо к разработчикам ядра обращаться ИМХО.
Да наверное, хотя надо попытаться локализовать проблему, она могла возникнуть где угодно в ядре...

Cейчас попробую собрать ядро без i8042 и понаблюдать

З.Ы. Куда лучше писать с такими проблемами? Какая-нибудь багзилла или список рассылки?

xorik ★★★★★
() автор топика

Фиг, пересобрал без поддержки мыши и клавиатуры, все равно зафризилось насмерть через пару минут, после загрузки

xorik ★★★★★
() автор топика

простите что не помогу ничем, но опишу то , что делается у меня,
ядра > .29

конфигурация одна и та же, меняется только оптимизация под процессор

ноутбук Asus A6, с процессором Celeron M ( Pentium-M)

1) -march=i686
паника сразу при загрузке или в течении 15 минут
2) -march=i686 -mtune=pentium-m
около 6 часов аптайм, потом паника
3) -march=pentium4 -mtune=pentium4 (да, это netburst)
.... работает, стабильно

вот ни о какой предсказуемости тут речи нет, нужен бубен ... и особая магия

Sylvia ★★★★★
()
Ответ на: комментарий от Sylvia

Нет, до паники не доходит, просто фризается изображение, и по ssh не зайти...
А где параметры компиляции ядра указать, чтоб попробовать?

xorik ★★★★★
() автор топика
Ответ на: комментарий от xorik

>Пробовал ядро ванильное, гентушное, ubuntu-9.10 разные версии, везде зависания или нестабильности...

меня вот это смущает, что с убунтушным то же самое, можно до кучи еще попробовать каких-нибудь livecd и отписывать в багзиллу ядерщикам , с выводами

lshw
dmidecode
lspci
lsusb
dmesg
lsmod

Sylvia ★★★★★
()
Ответ на: комментарий от xorik

кстати ноуты у нас по начинке похожи..

00:00.0 Host bridge: ATI Technologies Inc Device 5a31 (rev 01)
00:01.0 PCI bridge: ATI Technologies Inc RS480 PCI Bridge
00:13.0 USB Controller: ATI Technologies Inc IXP SB400 USB Host Controller
00:13.1 USB Controller: ATI Technologies Inc IXP SB400 USB Host Controller
00:13.2 USB Controller: ATI Technologies Inc IXP SB400 USB2 Host Controller
00:14.0 SMBus: ATI Technologies Inc IXP SB400 SMBus Controller (rev 11)
00:14.1 IDE interface: ATI Technologies Inc IXP SB400 IDE Controller
00:14.3 ISA bridge: ATI Technologies Inc IXP SB400 PCI-ISA Bridge
00:14.4 PCI bridge: ATI Technologies Inc IXP SB400 PCI-PCI Bridge
00:14.5 Multimedia audio controller: ATI Technologies Inc IXP SB400 AC'97 Audio Controller (rev 02)
00:14.6 Modem: ATI Technologies Inc SB400 AC'97 Modem Controller (rev 02)
01:05.0 VGA compatible controller: ATI Technologies Inc RC410 [Radeon Xpress 200M]
02:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL-8139/8139C/8139C+ (rev 10)
02:01.0 CardBus bridge: Ricoh Co Ltd RL5c476 II (rev b3)
02:01.1 SD Host controller: Ricoh Co Ltd R5C822 SD/SDIO/MMC/MS/MSPro Host Adapter (rev 17)
02:01.2 System peripheral: Ricoh Co Ltd R5C592 Memory Stick Bus Host Adapter (rev 08)

Sylvia ★★★★★
()
Ответ на: комментарий от Sylvia

>меня вот это смущает, что с убунтушным то же самое
Да то же самое, с i8042.reset i8042.nomux i8042.noaux позже, без него сразу почти, хотя иногда и грузится (~10% шанс)

Я сомневаюсь, что в других диструбутивах что-то сильно отличается
Так что я два выхода вижу:
1) забить и сидеть на 2.6.30, до покупки нового ноута :)
2) скачать git ядро и искать бинарным поиском в каком коммите сломали (даже не представляю, сколько на это времени уйдет, даже если предположить, что сломали input).
3) попробовать собрать минимальное ядро, потом наращивать его и если повезет найду глючащий модуль (если минимальное нормально заработает)

xorik ★★★★★
() автор топика
Ответ на: комментарий от Sylvia

>с acpi=off не лучше ?
Убунтушное лив-сиди паникует, а ванильное вроде работает (только иксы не запустились). Сейчас верну мышь и клаву, соберу hal с USE=-acpi и проверю...

xorik ★★★★★
() автор топика

Подобные галлюны наблюдал на декстопе с какой-то встроеной сетевушкой. Отключи ее и посмотри что будет.

xintrea
()
Ответ на: комментарий от xorik

>1) забить и сидеть на 2.6.30, до покупки нового ноута :)
Можно вообще на 2.6.27 съехать, если оно тянет ваше оборудование. Как-никак, секьюрити-/багфиксы are included.

Deleted
()
Ответ на: комментарий от Sylvia

Такая же фигня. Обновился до убунты 9.10. перезагрузился пару раз, ибо пропали значки в трее, начал восстанавливать. Потом в один прекрасный момент не знаю почему, она просто перестала грузиться. Вместо полосы загрузки бунты - черный экран и никакие мыши и т.п. вещи не помогают, пришлось все сносить и ставить опять 9.04. Пока все не устаканицо, буду сидеть на своём .28 =)

З.Ы. объясните мне непонятливому, что такое ванильное ядро?)

dumplock
()
Ответ на: комментарий от Sylvia

>Подобные галлюны наблюдал на декстопе с какой-то встроеной сетевушкой. Отключи ее и посмотри что будет.
Отключил, не помогло

попробуйте второй вариант, с ограничениями acpi

Пробовал разные комбинации acpi=noirq pci=noacpi acpi_osi=Linux
При acpi_osi=Linux повисает на «waiting for uevents to be processed...»
При других либо повисает, либо один раз работало нормально, но loadavg постоянно увеличивался...
С acpi=off вроде бы всё работает, только иксы не включаются. Сейчас попробую собрать xorg-server без hal'а, может быть запустится...

xorik ★★★★★
() автор топика
Ответ на: комментарий от Deleted

>Можно вообще на 2.6.27 съехать, если оно тянет ваше оборудование.
Можно... Долго он еще поддерживаться будет? Как там с ext4?

xorik ★★★★★
() автор топика
Ответ на: комментарий от dumplock

Ванильное значит без патчей дистростоителей, с kernel.org

xorik ★★★★★
() автор топика
Ответ на: комментарий от xorik

будет долго поддерживаться, Грег Кроа-Хартманн обещал что будет долго патчить

ext4 там нет (есть с 28 только)

только ext4dev

Sylvia ★★★★★
()
Ответ на: комментарий от annoynimous

тут вообщем то обсуждается ванильное..
а не то что в Федоре, и там не один этот патч, а много чего еще наверняка

Sylvia ★★★★★
()

Блин, похоже дело не в acpi, потому с acpi=off вылезли глюки с usb: lshw повис при сканировании usb, а подсветка у мыши вообще не горела

xorik ★★★★★
() автор топика
Ответ на: комментарий от anTaRes

Сейчас загрузился с acpi=off и noapic, всё стабильно 50 минут. Без acpi=off повисло на fsck. Такое ощущение, что чем больше возможностей вырубишь, тем стабильнее будет работа :)
Сейчас еще проверю на повторяемость, может это просто удачная попытка была. Потом поиграюсь с архитектурой процессора и irqpoll

xorik ★★★★★
() автор топика
Ответ на: комментарий от xorik

У тебя сислог настроен? Ошибки кажет? dmesg увидеть можно? А то знаешь симптомы симптомами а что там конкретно...

Да я с 2.6.32 тоже не совладал. Там ACPI поломали конкретно... До такой степени что у меня из *32 ядра после init 0 вообще даже биос не стартует. Вынимаешь батарейку у ноута тогда стартует... И проверял и на sys-kernel/gentoo-sources-2.6.32 и на sys-kernel/vanilla-sources-2.6.32 поведение одинаково страшное. И это с учетом того что на всех ядрах до *32 вообще ноль проблем.

init_6 ★★★★★
()
Ответ на: комментарий от init_6

В dmesg тишина, просто симптомы такие, что система слоупочит еще при загрузке, и в любой момент мозет остановиться, что даже по ssh не подключишься.
Но похоже irqpoll решает проблему, сейчас еще попробую несколько раз загрузится, потом отпишусь...

xorik ★★★★★
() автор топика
Ответ на: комментарий от xorik

irqpoll решил проблему тормозов, но не решил проблему зависаний. Может быть проблема не в ядре, а в каком-нибудь сервисе, который надо обновить/пересобрать...

xorik ★★★★★
() автор топика
Ответ на: комментарий от xorik

в init 3 тоже виснет ?
загрузить в init 3 (хинт: вроде если 3 передать параметром ядра то система сразу в init 3 загрузится (без иксов) )
ну и попробовать погонять файлики по сети, по разделам, нагрузить проц и т.п.
если перестанет виснуть , значит проблема ближе к иксам (ну и т.д.)

может быть и такое, что система просто перегревается, от чего и зависания

anTaRes ★★★★
()
Ответ на: комментарий от Sylvia

> конфигурация одна и та же, меняется только оптимизация под процессор
Плохой компилятор?

anonymous
()
Ответ на: комментарий от anonymous

брала разные, от 4.1 до 4.4 , как простые так и с redhat веток,
фактически наиболее стабильным оказался 4.2.4 (ванильный), с остальными вообще кошмар делается, причем только на ноуте


кстати линусу не мешало бы исправить требования к GCC (у него стоит 3.2)
с 3.4.6 не собирается уже

Sylvia ★★★★★
()

В общем вечером загружал систему с параметрами /boot/kernel-2.6.32 vga=0x318 i8042.reset i8042.nomux i8042.noaux irqpoll, предварительно выключив acpid hald и xdm, и запустил в консоли: sudo emerge -bke xorg-server

Когда пришел ноут был выключен, последние строки emerge.log:

1260192875:  === (55 of 182) Cleaning (sys-apps/usbutils-0.82::/usr/portage/sys-apps/usbutils/usbutils-0.82.ebuild)
1260192875:  === (55 of 182) Compiling/Packaging (sys-apps/usbutils-0.82::/usr/portage/sys-apps/usbutils/usbutils-0.82.ebuild)
 ITV_IRQ_MASK(itv)  (itv&(1<<16))

static inline void vcpu_set_itv(struct kvm_vcpu *vcpu, u64 val)
{
        VCPU(vcpu, itv) = val;
        if (!ITV_IRQ_MASK(val) && vcpu->arch.timer_pending) {
                vcpu_pend_interrupt(vcpu, ITV_VECTOR(val));
                vcpu->arch.timer_pending = 0;
        }
}

stat
Интересно откуда сишный код там о_О Какие логи еще можно поглядеть?

P.S. Еще интересно, что когда по ssh заходил, то всё тормозило, а локально не тормозило, может сетевая подсистема виновата... P.S.S. Я ССЗБ, оказывается sysklogd не был запущен, так что я ничего не увидел, сейчас починю и буду глядеть в логи

xorik ★★★★★
() автор топика
Ответ на: комментарий от anTaRes

>в init 3 тоже виснет ?
вот сейчас проверяю, пока тьфу тьфу :)

может быть и такое, что система просто перегревается, от чего и зависания

Не, я целыми сутками компилил на этом ноуте ему пофигу было (пересобирал мир)

xorik ★★★★★
() автор топика
Ответ на: комментарий от xorik

Интересно откуда сишный код там о_О


ну очевидно же - static inline void :)
шутка

anTaRes ★★★★
()

Спасибо всем, проблему вроде локализовал.
Тормоза починились с помощью параметра irqpoll, а зависания были из-за wifi (завтра попробую поставить wireless-tools, madwifi-ng и wpa_supplicant из ~arch).

Из замеченных недостатков: hibernate вешает систему, при компиляции графика заметно тормозит (например шлейф у окон при перемещении, тормоза скролла в фф). Возможно всё лечится пересборкой/обновлением

xorik ★★★★★
() автор топика
Ответ на: комментарий от xorik

Рано обрадовался.... В single mode всё зависло :( В логах опять тишина...

xorik ★★★★★
() автор топика

>Я добавил параметры к ядру: i8042.noaux (отключил точпад) и зависания стали реже, но не исчезли.

У меня Linux eJiffy на материнке ECS A785GM-M тоже не грузится (это — родной загрузочный дистрибутив для этой материнки, шёл в комплекте к ней на LiveCD). Пишет про какую-то проблему с i8042 и каким-то таймером на APIC bus.

Пляски вокруг пунктов настроек BIOS Setup (выключение/включение ACPI, задание различного размера выделенной памяти для интегрированного графического ядра, включение/отключение поддержки eJiffy) ни к чему не привели.

FreeBSD 8.0-STABLE работает на этом железе превосходно.

iZEN ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.