LINUX.ORG.RU

Хайзенбаг в действии или как починить нечинимое

 , , , ,


2

3

Имею ноутбук DNS C17A (да, знаю, сам виноват)

Проблема следующего характера: сразу после включения все работает хорошо, но недолго: стоит загрузить тяжелую страницу или выполнить операцию, нагружающую ЦП, происходит ЭТО: кулер начинает активно вращаться и появляются тормоза...Ну вот серьезные тормоза.

ПЕРЕГРЕВ скажите вы и будете неправы, ибо:

1) перегрева нет судя по sensors;

2) по прошествии времени проблема не исчезает;

3) кулер работает не на всю мощь;

Что удалось выяснить:

1) повторяя одни и те же операции после включения, данный баг проявлятся не в одно и то же время, а то и вовсе может не проявиться (вероятность его словить в первые пять минут - 80%)

2) Если отправить ноут в спящий режим и пробудить проблема исчезает, но вскоре возвращается

3) lscpu после появления проблемы показывает частоту не ниже 2.7 GHz, хотя до проявления проц ее спокойно скидывает, даже под легкой нагрузкой, до 1.2 - 1.6 и ничего не тормозит

4) И самое странное - с момента проявления этого бага htop показывает загрузку одного ядра в районе 83-85% и показывает ее красным цветом (как нагрузка от потока ядра) - . Никто кроме htop этого не видит! Использование CPU kworker'ами по нулям!

5) Дабы исключить проблему в своей системе - попробовал загрузиться с LiveUSB - баг также имеет место (скрин htop: http://imgur.com/a/sKFa5)

6) Не зная нормальных утилит для бенчмарка - поставил WinRAR в Wine и он показывает следующие цифры: ~ 2900 до бага, ~1800 после

Лог dmesg, когда проблема не проявилась: https://pastebin.com/CfSNutvt

Он же, после проявления (другое включение, если что): https://pastebin.com/v9rH6Xvt

Похоже, что проблема аппаратная. Есть ли возможность решить ее программными средствами? Что можно попробовать?

★★★★★

Были ли произведены раскопки интернетов на предмет свежего биоса и чем закончились, если были произведены? Кстати, а в каком режиме грузишь - UEFI или Legacy? Если Legacy, то почему? Может быть кривая эмуляция биоса.

pekmop1024 ★★★★★
()
Последнее исправление: pekmop1024 (всего исправлений: 1)
Ответ на: комментарий от pekmop1024

Новее биоса, чем тот что есть - не нашел. Может плохо искал. Обычную систему гружу в EFI, но LiveUSB запустил в режиме Legacy, чтобы исключить и эту проблему тоже, но все так как есть

r0ck3r ★★★★★
() автор топика

acpi=off в параметры ядра.

Помогло? Иди к хакинтошникам за ровными acpi-таблицами для твоего железа, или в биос их, или через граб грузи.

timdorohin ★★★★
()
Ответ на: комментарий от pekmop1024

Сюда не смотрел и, как оказалось, зря! На верхушке его выхлопа красовался модуль rtl_pci. Выгрузка этого модуля и использующего его rtl8723ae с последующей загрузкой временно решила проблему. Тут гугланулся аналогичный баг: https://ask.fedoraproject.org/en/question/95438/irq17-rtl_pci-high-cpu-usage/ но решения нет. Кто что думает? Параметры может какие указать модулю нужно?

r0ck3r ★★★★★
() автор топика
Последнее исправление: r0ck3r (всего исправлений: 1)
Ответ на: комментарий от Deleted

не думаю, что проблема с памятью - внезапных сегфолтов не ловил

r0ck3r ★★★★★
() автор топика
Ответ на: комментарий от timdorohin

раньше пробовал - не помогало

r0ck3r ★★★★★
() автор топика

DNS C17A

Внутри «ноутов» DNS частенько установлена материнка Clevo. Можно выгуглить ноуты с такой же материнкой и копнуть как дела обстоят у них. Потому что Clevo это крупный вендор ODM и поставляет материнки/делает ноуты на заказ много для кого.

Можно прошить свежий биос от другой модели ноута с такой же материнкой - если производитель не забил на обновления.

Больше хз чем помочь.

fcx ★★★
()
Последнее исправление: fcx (всего исправлений: 1)
Ответ на: комментарий от r0ck3r

1. смутно вспоминается о каком-то подобном ядерном баге, правда это началось вроде еще на 3.хх, устранили ли - неясно. Поэтому проверьте еще на паре live с заметно различными версиями. Проделать это очень желательно, потому что вы до сих пор даже не определились - что виновато - софт или железо

2. Вифи кнопочкой отключается? отключите. Если нет и не лень - слазайте внутри и вытащите.

3. Слышал подобную историю от знакомого. Он грешит на каке-то пороговые эффекты в процессоре, потому что ревизия системы охлаждения с заменой пасты ему помогла.

vaddd ★☆
()
Ответ на: комментарий от theLastOfCats

Pegatron

Эти часто в ноутах ASUS вижу.

С прошивками на пегатрон дело похуже, да(

Но, возможно, есть модель-двойник от Асуса и патченый BIOS с whitelist для него на случай замены вафельного модуля.

fcx ★★★
()
Ответ на: комментарий от r0ck3r

не понял. Как? В том смысле, что саму карту сменить?

Именно. Копейки стоит.

pekmop1024 ★★★★★
()

Похоже, что проблема аппаратная

Я не вижу на основании чего ты сделал такой вывод. Для начала я бы накатил ОС рекомендованную производителем ноутбука и для которой есть 100% рабочие драйвера. Да, я скорее всего про винду. И убедился что проблема не прораммная.

mbivanyuk ★★★★★
()
Ответ на: комментарий от r0ck3r

Есть LiveCD же. Хотя уже смысла нет, это косяк линукса, что я и хотел понять. Меняй на венду, или вай-фай модуль другой поставь, они не стоят ничего.

a111
()
Ответ на: комментарий от theLastOfCats

Это ссаный Pegatron.

там же яблодевайсы клепают

anonymous
()
Ответ на: комментарий от fcx

Вряд-ли ОЕМ производитель мутит whitelist-ы для сетевух в свои прошивки, это куда актуальней для брендов. Но вот идея найти по платформе - отличная, обновлял так биос для BenQ Joybook R55 когда-то.

miXel
()
Ответ на: комментарий от miXel

без вайфай проблема исчезает - достаточно выгрузить модуль rtl8723ae. Если загрузить его обратно - проблема сразу повторяется. Еще, нашел способ гарантированно вызвать баг - достаточно начать что-то скидывать с самба шары (по всей видимости баг выявляется, когда Wi-Fi модуль используется на всю мощь).

Пробовал собрать этот модуль: https://github.com/lwfinger/rtlwifi_new.git

но и с ним поведение абсолютно аналогично. Думаю о смене карты

r0ck3r ★★★★★
() автор топика
Ответ на: комментарий от pekmop1024

Спасибо за помощь в локализации проблемы!

r0ck3r ★★★★★
() автор топика
Ответ на: комментарий от r0ck3r

Чур тебя, не покупай бродком, будет еще веселее :)

Intel 8260, говорят, хороший.
Однако, мне мой 7260 не очень нравится, но когда я покупал, еще не было атеросов с 802.11ac. Надо призвать владельцев свежих атеросов с историей узбеков.

pekmop1024 ★★★★★
()
Ответ на: комментарий от pekmop1024

для двухдиапазонных, похоже, требуется две антенны, а у меня только одна, так что беру Atheros

r0ck3r ★★★★★
() автор топика
Ответ на: комментарий от r0ck3r

Не обязательно. Ну и вообще, если апгрейдишь, смысл покупать без 802.11ac? Проверь еще, чтобы у тебя был miniPCIe, а не M.2

А антенну можно накостылять. Там же на али есть разные костылестроительные наборы.

pekmop1024 ★★★★★
()
Ответ на: комментарий от pekmop1024

да наборы видел, но костылять что-то не особо хочется.. Все-таки лучше без ac возьму, наверное.

Кстати да, за замечание по поводу разъема отдельная благодарность

r0ck3r ★★★★★
() автор топика
Ответ на: комментарий от pekmop1024

Ivy Bridge - спасибо!

Насчет дисплея - никогда не задавался таким вопросом, но похоже, что TN, так как при обзоре под большими углами по бокам и под небольшим снизу - изображение темнеет, а сверху - светлеет

r0ck3r ★★★★★
() автор топика
Ответ на: комментарий от r0ck3r

Можешь еще попробовать процессор четырехъядерный у тех же китайцев купить, если система охлаждения приличная. Цена вопроса около $100-150.

pekmop1024 ★★★★★
()
Ответ на: комментарий от pekmop1024

не вижу смысла, так как мой старичок i5-3230M вполне устраивает для ноута, а для более тяжелых задач у меня есть домашний Xeon

r0ck3r ★★★★★
() автор топика
Ответ на: комментарий от r0ck3r

А я вот свой домашний Xeon решил разбарахолить с целью взять Thinkpad P51. Тебе случаем железо не нужно? :)

pekmop1024 ★★★★★
()
Ответ на: комментарий от pekmop1024

Да выше же выяснили уже, что косой драйвер на не менее косой вайфай от реалтека все портит, ты чем читал?

Да ничего вы не выяснили для конкретно этого ноутбука, это все предположения. Чтобы выяснить надо поменять ОС (посмотрать будет ли проблема на рекомендованной ОС) и поменять wifi на заведомо исправный. Делать выводы не исключив все возможности методологически неправильно. Короче не шарите вы технике, неучи ))

mbivanyuk ★★★★★
()

Сам юзаю подобный бук, на Linux Mint 18. Зае****ся клавы менять. С загрузкой проца сталкивался, но решил её добавив строчку в блэк лист, давно уже это было.

kotov666
()
Ответ на: комментарий от miXel

Это я напейсал не раскрыв мысль - стоит поискать модифицированные BIOS с whitelist на, скажем, bios-mods.com, там тысячи их.

fcx ★★★
()
Ответ на: комментарий от mbivanyuk

Ну. А то пошла мода определять причину технических проблем голосованием

vaddd ★☆
()
Ответ на: комментарий от r0ck3r

а выгрузка модуля, исправляющая ситуацию, не является доказательством?

Доказательством того что проблема так или иначе связана с модулем? Является. Но как связана? Может модуль кривой и проблема программная, а может сам wifi глючит и вешает модуль и проблема в железе. А может модуль просто не совместим с чем-то не имеющим отношения к wifi или еще что, тут много чего может.

mbivanyuk ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.