LINUX.ORG.RU

Неожиданно встал винт

 


0

1

сабж, не отвечает ни на какие команды.

# dd if=/dev/sdc of=/dev/null
dd: чтение «/dev/sdc»: Ошибка ввода/вывода
0+0 записей считано
0+0 записей написано
 скопировано 0 байт (0 B), 0,0171012 c, 0,0 kB/c
в логах последним было это, потом куча однообразных ошибок.

сам диск: Seagate ST2000DL003

последнее, что делал - зеркалировал с него lvm-том. пока не перезагружался.

собственно что это? ошибка в ядре или диск умер? если второе, то почему?

попробуйте заменить sata шлейф

anonymous ()

я бы посмотрел smartctl -a, а потом бы заодно проверил бы его из-под доса через mhdd на плохие сектора.

BattleCoder ★★★★★ ()

проверь шлейф данных и разъем питания.
если заведется, то потом надо smartctl -a посмотреть на всякий..

aol ★★★★★ ()
Ответ на: комментарий от aol

после пары перезагрузок и отключения питания удалось восстановить работоспособность диска. после были пляски с бубном вокруг того, что lvm видел свои разделы, но считал из утерянными - тут тоже всё получилось...

шлейф в порядке. не считая того, что он полуметровый, хотя расстояние сантиметров 10.

остаётся две проблемы: 1) из-за чего всё это произошло как вариант - перегрев... охлаждение корпуса и дисков в частности у меня паршивое...

2) smartctl -a очень настораживает вот это:

goblin lvm # smartctl -a /dev/sdc |grep -i 'Raw_Read\|Seek\|ECC'
  1 Raw_Read_Error_Rate     0x000f   117   100   006    Pre-fail  Always       -       146908336
  7 Seek_Error_Rate         0x000f   100   253   030    Pre-fail  Always       -       669437
195 Hardware_ECC_Recovered  0x001a   030   023   000    Old_age   Always       -       146908336
goblin lvm # dd if=/dev/sdc1 of=/dev/null bs=4K count=128K
131072+0 записей считано
131072+0 записей написано
 скопировано 536870912 байт (537 MB), 3,72267 c, 144 MB/c
goblin lvm # dd if=/dev/sdc7 of=/dev/null bs=4K count=128K
131072+0 записей считано
131072+0 записей написано
 скопировано 536870912 байт (537 MB), 4,6513 c, 115 MB/c
goblin lvm # smartctl -a /dev/sdc |grep -i 'Raw_Read\|Seek\|ECC'
  1 Raw_Read_Error_Rate     0x000f   117   100   006    Pre-fail  Always       -       149017448
  7 Seek_Error_Rate         0x000f   100   253   030    Pre-fail  Always       -       669439
195 Hardware_ECC_Recovered  0x001a   030   023   000    Old_age   Always       -       149017448

Fat-Zer ()
Ответ на: комментарий от Fat-Zer

перегрев

Перегрев фиксируется в SMART. Хотя 46°C — это в любом случае слишком много. То есть да, это может быть причиной.

очень настораживает вот это

«Это» как раз в порядке. Другие параметры тоже, кроме температуры.

шлейф в порядке.

На основании чего сделан вывод?

охлаждение корпуса и дисков в частности у меня паршивое...

Можно ещё добавить возможный перегрев южного моста.

GotF ★★★★★ ()
Ответ на: комментарий от Fat-Zer

очень настораживает

Уж сколько раз твердили миру, что смотреть надо нормализованные значения.

redgremlin ★★★★★ ()
Ответ на: комментарий от GotF

Можно ещё добавить возможный перегрев южного моста.

ИМХО вряд ли... тогда бы всё встало колом, а не один диск...

На основании чего сделан вывод?

статистический вывод. на основании того, что он без нареканий работал до этого и сейчас работает, того, что никаких манипуляций с диском вообще и с корпусом в частности я давно не делал, и того, что я не верю в гремлинов, барабашек и домовых.

«Это» как раз в порядке. Другие параметры тоже, кроме температуры.

тогда что это значит? меня пугают такие большие цифры... а ещё больше то, что они растут. а также меня пугает, то что это количество ошибок...

Уж сколько раз твердили миру, что смотреть надо нормализованные значения.

хорошо... а нормализованные значения для диска, которому с полгода нормальные?

Fat-Zer ()
Ответ на: комментарий от Fat-Zer

тогда бы всё встало колом, а не один диск...

Всяко бывает.

на основании того, что он без нареканий работал до этого и сейчас работает, того, что никаких манипуляций с диском вообще и с корпусом в частности я давно не делал, и того, что я не верю в гремлинов, барабашек и домовых.

Это всё не аргументы. В таких случаях кабели (и power, особенно если он переходником с molex) принято менять на новые, не дожидаясь повторения проблем.

тогда что это значит?

Что диск работает.

GotF ★★★★★ ()
Ответ на: комментарий от GotF

Это всё не аргументы. В таких случаях кабели (и power, особенно если он переходником с molex) принято менять на новые, не дожидаясь повторения проблем.

power от блока... а шлейф - пусть будет... раз решили, что температура...

Что диск работает.

ладно... буду радоваться и наслаждаться жизнью...

Fat-Zer ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.