LINUX.ORG.RU

Что умирает?


0

0

Вопрос сабжевый. И умирает ли вообще.

Симптомы - периодически система стала перегружаться. Иногда просто сильно тормозит и с винта ничего не читает. Вот что в dmesg:

hde: dma_timer_expiry: dma status == 0x21
hde: DMA timeout error
hde: 0 bytes in FIFO
hde: timeout waiting for DMA
hde: dma timeout error: status=0x58 { DriveReady SeekComplete DataRequest }
ide: failed opcode was: unknown
hde: task_in_intr: status=0x51 { DriveReady SeekComplete Error }
hde: task_in_intr: error=0x04 { DriveStatusError }
ide: failed opcode was: unknown
hde: task_in_intr: status=0x51 { DriveReady SeekComplete Error }
hde: task_in_intr: error=0x04 { DriveStatusError }
ide: failed opcode was: unknown
hde: task_in_intr: status=0x51 { DriveReady SeekComplete Error }
hde: task_in_intr: error=0x04 { DriveStatusError }
ide: failed opcode was: unknown
hde: task_in_intr: status=0x51 { DriveReady SeekComplete Error }
hde: task_in_intr: error=0x04 { DriveStatusError }
ide: failed opcode was: unknown
ide2: reset: success
hde: dma_timer_expiry: dma status == 0x21
hde: DMA timeout error
hde: 0 bytes in FIFO
hde: timeout waiting for DMA
hde: dma timeout error: status=0x58 { DriveReady SeekComplete DataRequest }
ide: failed opcode was: unknown
hde: dma_timer_expiry: dma status == 0x21
hde: DMA timeout error
hde: 0 bytes in FIFO
hde: timeout waiting for DMA
hde: dma timeout error: status=0x58 { DriveReady SeekComplete DataRequest }
ide: failed opcode was: unknown
hde: dma_timer_expiry: dma status == 0x21
hde: DMA timeout error
hde: 0 bytes in FIFO
hde: timeout waiting for DMA
hde: dma timeout error: status=0x58 { DriveReady SeekComplete DataRequest }
ide: failed opcode was: unknown
spurious 8259A interrupt: IRQ7.

Понять не могу, кто виноват: винт, мать или ядро?

Винт висит на raid-контроллере (ибо на этой матери только он дает ATA-100).

Самое интересное, что если на обычный IDE-контроллер подвесить любой винт (уже пять штук разных перепробовал), то через некоторое время они начинают просто виснуть примерно с теми же симптомами. Зато CD-ROM'ы живут без проблем.

Ничего не понимаю.

★★★★★

Необязательно что то умирает
В конфиге ядра

config IDEDISK_MULTI_MODE
bool "Use multi-mode by default"
help
If you get this error, try to say Y here:

hda: set_multmode: status=0x51 { DriveReady SeekComplete Error }
hda: set_multmode: error=0x04 { DriveStatusError }

If in doubt, say N.

sova ★★
()

шлейф, сильные наводки, материнка ASUS, ядро.

lenin
()

Думаю умирает сама схема... или плохой контакт на разъёмах и плате...

binr ★★
()

Ядро не может быть? У меня на Debian один экземпляр такой ошибки через раз выдавался при инициализации. А потом обновил ядро, и все стало нормально.

Zubok ★★★★★
()

Что-то подобное встречалось на проблемных контроллерах... Надо бы попробовать тот же диск ещё где-нить поэксплуатировать.. Если с диском порядок, попробовать другое ядро, заменить контроллер, мать ну и так далее..

MiracleMan ★★★★★
()

Спасибо за советы. Буду пробовать.

jackill ★★★★★
() автор топика
Ответ на: комментарий от anonymous

Seagate Barracuda IV ATA 100 на 40Гб. Вроде так.

Model=ST340016A

jackill ★★★★★
() автор топика
Ответ на: комментарий от sova

Фишка в том, что miltimode в конфиге стоит.

jackill ★★★★★
() автор топика

Было весьма давно подобное у коллеги. Но с точностью до наоборот. Винты живут, CD-ROM (810-й гнусмас) -- нет. Вставляешь контроллер типа Promise Ultra100 (не реклама, там практически ЛЮБОЙ внешний контроллер снимает проблему) -- всё как часы.

Диагноз: чипсет VIA + [не-уиндоуз].

Obidos ★★★★★
()
Ответ на: комментарий от Obidos

Тут честный 440BX (на нем висит cd-rom и на него вешались другие винты), а основной винт висит на HTP370. Поддержка подо все есть.

Самое интересное, что машина виснет непонятно когда. Поначалу честно вырубает dma, 32-битный доступ к винту и с ata100 переходит на pio4.

jackill ★★★★★
() автор топика
Ответ на: комментарий от jackill

Сейчас более другое ядро соберу - может поможет.

jackill ★★★★★
() автор топика

встречался подобный случай. проблема была в том, что на хард кулера повесили. и они на палту (на харде) пыть всякую нагнетали. работает все, работает... а потом вдруг перестает. в лог тоже что то подобное сыпалось. и машина могла в любой момент ребутнуться. пропылесосил пыль и все стало работать нормально. После этого просто снял кулер. Еще думал развернуть винтиляторы, чтоб не на плату дули а наоборот воздух прогоняли.

samson ★★
()
Ответ на: комментарий от samson

Такие ошибки в моей практике были в двух случаях -- дохлый винт ("дятел") и плохой шлейф. В последнем случае внешних признаков не было. Для диагностики загрузите что-то другое (Кноппикс, винды, полуось) -- будут аналогичные симптомы -> не ядро. Хочу еще сказать: кулер на "подбрюшье" винта -- смерть винчестеру! В двигателях вентиляторов магниты. Они не в состоянии перемагнитить диски, но создают, вращаясь, наводки на головки и входной усилитель. Результатом становится множество ремапов, а потом винт "стучит головками", теряя дорожку. Особенно страдают Seagate 7200.7.

Jar
()
Ответ на: комментарий от Jar

> кулер на "подбрюшье" винта -- смерть винчестеру!

согласен. раньше не задумывался об этом. раньше все боялся, что вдруг перегреваться будет... Кстати, Seagate один так и сдох, не знаю из-за кулера или еще из-за чего, но сдох и кулер на нем стоял.

samson ★★
()

А шлейф у тебя правильный? А судя по симптомам - контакт где-то паршивый.

Еще может быть блок питания. Померяй наприяжение. Хотя этого мало, надо бы еще осциллографом пульсации посмотреть.

У меня на BX висит UDMA-100 винт (Самсунг), и до недавнего времени висел другой - IBM, ясен пень что в UDMA33 режиме. Но никаких проблем (кроме того, что в ядрах новее 2.4.19 сломали поддержку UDMA44. Я слал патч тогда, но его проигнорировали), а тачка уже четыре года не выключалась больше чем на пару-тройку часов в год - добавить чего-нибудь. Так что про HPT ничего не скажу, но на стандартном контроллере должно работать. Если переключишь на стандартный разъем, а проблемы сохранятся - точно, либо шлейф, либо контакт, либо БП.

alt-x ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.