LINUX.ORG.RU

Причины появления UDMA_CRC_Error_Count


0

1

Я уже создавал тему частично по этому поводу: http://www.linux.org.ru/forum/admin/5995673

Так вот, даже смена кабелей не повлияла на ситуацию: проклятая ошибка время от времени продолжала всплывать всё с тем же характерным

hard resetting link

в messages, причём на обоих компонентах зеркала (не одновременно, конечно) — обычного mdraid. ЕМНИП, рассинхронизация случилась лишь однажды, что, очевидно, не отменяло необходимость оперативного вмешательства при очередном инциденте… Но ведь RAID был применён совсем не для траты времени на его проверки в случайное время :)

Учитывая, что: появление этой гадости не сопровождалось хоть какой-либо нагрузкой на диски, она возникала только на компонентах RAID, до начала использования RAID она никогда не случалась, и, наконец, её причиной может быть что угодно, включая ОС, у меня возникло логичное подозрение — проблема может быть связана с RAID. Основных версий две:

1) MD и дисковый контроллер (стандартный на ASUS M2A-VM) не вполне уживаются.

2) Дисковый контроллер ловит какой-то необычный баг при ~параллельном I/O на два устройства (бред, по-моему).

Диски Seagate ST3500418AS, прошивка менялась дважды. За две недели без второго компонента массива ошибка не появлялась, хотя, конечно, срок маловат.

Теперь собственно вопросы:

1) Возможно ли то, что я предположил выше? Какие ещё могут быть причины?

2) Имеет ли смысл попробовать встроенный fake-raid (Promise FastTrack) через dmraid или лучше сразу пилить синхронизацию rsync по расписанию, вместо зеркала? Зеркалирование средствами самого LVM не вдохновляет абсолютно, покупать плату аппаратного контроллера дорого и просто глупо для дома.

Извините за многабукаф :)

★★★★★

какой-то экзотический глюк.
у меня на P43 собран боевой почтовик с зеркалированием. никаких hard reset link.
mdadm зеркало на таких же винтах.
мб стоит обновить прошивку на маме?

Suicide_inc ★★
()
Ответ на: комментарий от Suicide_inc

>> мб стоит обновить прошивку на маме?

Последняя стоит. На предыдущей было то же.

GotF ★★★★★
() автор топика

Читал о fake-raid, не вдохновило — даже элементарную проверку нельзя сделать без костылей, да и работает оно как-то мутно.

Есть идея перебросить второй диск на другой порт, чтобы компоненты были подальше друг от друга (хотя не уверен, что это имеет значение для SATA) — если это действительно столь экзотичный баг, то почему бы и нет %)

GotF ★★★★★
() автор топика

> 1) Возможно ли то, что я предположил выше? Какие ещё могут быть причины?
Несовместимость контроллера и винчестера, возможно и драйвера.
У меня было такое когда WD6400AAKS пытался на старый sata-150 контроллер повесить.

isn ★★
()

Лечилось заменой винтов :)

Jetty ★★★★★
()

Это скорее всего несовместимость винтов и контроллера на матери.
Проверяется элементарно - втыкаются какие-нибудь два других винта, желательно другой фирмы, и вперед, делать из них зеркало и гонять в хвости и гриву.

У меня похожая ситуация была - двухпортовый контроллер SATA600 на каком-то чипе марвелл и два винта на 2Тб Seagate LP, какое-то время работает, а потом резко начинает гадить Soft resetting link / Hard resetting link и в итоге mdraid разваливается, т.к. сначала выплёвывается один винт, а потом и второй.

При этом подключив винты через USB-SATA коробки у меня всяческие проблемы с ними исчезли, а этот контроллер как eSATA у меня работает сейчас отлично с другими винтами...

blind_oracle ★★★★★
()

За месяц с момента создания темы новых ошибок не было. Вероятно, что-то из моих манипуляций возымело эффект.

GotF ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.