LINUX.ORG.RU

SCSI disk error 8000002 на здоровом винте


0

0

Повторно. Извиняюсь за форматирование. Просьба удалить предыдущее

Очень прошу!!! Подскажите ЧТО ДЕЛАТЬ?

Имеется: сервер - три хотсвап-SCSI винта - две корзины.
В kern.log периодически падает ошибка на sdc (сега)
в момент записи, без разницы в какую корзину его ставить.
Контроллер корзины меняли - тоже самое.
badblock (ro) бад-ов не видитт.
А оба IBM-а работают без проблем (sda, sdb).
Может причина, что сега Ultra 320, Adaptec - 160?
----------------------
kern.log:
May 31 21:15:15: SCSI disk error : host 0 channel 0 id 12 lun 0
return code = 8000002
May 31 21:15:15: Current sd08:23: sense key Hardware Error
May 31 21:15:15: Additional sense indicates Defect list error
May 31 21:15:15: I/O error: dev 08:23, sector 21974368
----------------------
gmesg:
Linux version 2.4.20 (gcc version 2.95.4 20011002 (Debian prerelease))
SCSI subsystem driver Revision: 1.00
scsi0 : Adaptec AIC7XXX EISA/VLB/PCI SCSI HBA DRIVER, Rev 6.2.8
<Adaptec aic7899 Ultra160 SCSI adapter>
aic7899: Ultra160 Wide Channel A, SCSI Id=7, 32/253 SCBs
scsi1 : Adaptec AIC7XXX EISA/VLB/PCI SCSI HBA DRIVER, Rev 6.2.8
<Adaptec aic7899 Ultra160 SCSI adapter>
aic7899: Ultra160 Wide Channel B, SCSI Id=7, 32/253 SCBs
Vendor: IBM Model: IC35L018UCPR15-0 Rev: S70H
Type: Direct-Access ANSI SCSI revision: 03
(scsi0:A:1): 160.000MB/s transfers (80.000MHz DT, offset 63, 16bit)
Vendor: IBM Model: IC35L018UCPR15-0 Rev: S70H
Type: Direct-Access ANSI SCSI revision: 03
(scsi0:A:3): 160.000MB/s transfers (80.000MHz DT, offset 63, 16bit)
Vendor: ESG-SHV Model: SCA HSBP M9 Rev: 0.13
Type: Processor ANSI SCSI revision: 02
Vendor: SEAGATE Model: ST336607LC Rev: 0007
Type: Direct-Access ANSI SCSI revision: 03
(scsi0:A:12): 160.000MB/s transfers (80.000MHz DT, offset 63, 16bit)
scsi0:A:1:0: Tagged Queuing enabled. Depth 128
scsi0:A:3:0: Tagged Queuing enabled. Depth 128
scsi0:A:12:0: Tagged Queuing enabled. Depth 128
Vendor: ESG-SHV Model: SCA HSBP M9 Rev: 0.13
Type: Processor ANSI SCSI revision: 02
Attached scsi disk sda at scsi0, channel 0, id 1, lun 0
Attached scsi disk sdb at scsi0, channel 0, id 3, lun 0
Attached scsi disk sdc at scsi0, channel 0, id 12, lun 0
SCSI device sda: 35843670 512-byte hdwr sectors (18352 MB)
Partition check:
sda: sda1 sda2 sda3 sda4
SCSI device sdb: 35843670 512-byte hdwr sectors (18352 MB)
sdb: sdb1 sdb2
SCSI device sdc: 71687372 512-byte hdwr sectors (36704 MB)
sdc: sdc1 sdc2 sdc3
Attached scsi generic sg2 at scsi0, channel 0, id 6, lun 0, type 3
Attached scsi generic sg4 at scsi1, channel 0, id 6, lun 0, type 3

anonymous

Ответ на: Re: SCSI disk error 8000002 на здоровом винте от Deleted

Re: SCSI disk error 8000002 на здоровом винте

Не думаю, что дохнет. Винт новый, сектора всегда разные, может дней 10 работать чисто, потом опять. На винт пишутся только архивы (ежедневно). Код 8000002 - якобы "контроллер теряет корзину(или винт)". Коды не нашла, нашла сообщение о такой же ошибке на точно такой же сеге, только не LC а LW, с предположением "завышена скорость передачи данных". Может все же нестыковка контроллер/винт/ядро ??

Была другая проблема на другом серваке тоже со SCSI, решилась обновлением ядра. Знать бы что поможет, заменила бы на 2.6, а то без нужды трогать не желательно, толпа за 70 юзверей на нем. Очень признательна если кто поможет.

anonymous ()
Ответ на: Re: SCSI disk error 8000002 на здоровом винте от Deleted

Re: SCSI disk error 8000002 на здоровом винте

В догонку: в аппаратных логах про винты ничего. /только темпер. и корпус не закрытый/

anonymous ()
Ответ на: Re: SCSI disk error 8000002 на здоровом винте от Deleted

Re: SCSI disk error 8000002 на здоровом винте

Обновляю с 2.4.20 на 2.4.32, о результатах сообщу.
Может и не помочь, т.к. есть сообщение о том же глюке на такой же сеге, но уже с RedHat 7.3
----
ЗЫ: меня неделю не было вообще, но вопрос по-прежнему актуален.
Кто-что знает, не жмитесь! поделитесь!

anonymous ()
Ответ на: Re: SCSI disk error 8000002 на здоровом винте от Deleted

Re: SCSI disk error 8000002 на здоровом винте

Уважаемый Dimez, обновление на 2.4.33-pre3 не помогло

smartctl -a пишет, что "Healf OK", при этом - что куча ошибок
чтения-записи и "Non-mediun error count: 6"

Hardware Error приводит к sense key = Medium Error, это уже реальные бады - увы 2 бада в наличии, возникли прямо на глазах

Уже не знаю что дальше делать, с благодарностью приму любой совет.

anonymous ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.