LINUX.ORG.RU

HDD «исчез» при копировании

 , , ,


0

2

Купил с пылу с жару Ultrastar июньского производства (не SMR). Прогнал по одному проходу на каждый стандартный паттерн badblocks. Прогнал оба теста smartctl. Никаких ошибок, все ок. Создал один раздел на 95% свободного пространства, поверх накатил luks, отфарматировал в ext4. Дальше запустил rsync, чтобы скопировать данные со старого HDD, который меньше в 2 раза по объему. Через какое-то время (какое точно не знаю, т.к. запускал на ночь) вижу, что rsync зафейлился на 3 Tb. Ошибку не записал дословно, а зря. Было что-то вроде rsync не может копировать, потому что закончилось место на целевом диске. Дальше копаю логи. В dmesg такое

[Oct15 23:53] blk_update_request: I/O error, dev sda, sector 1053233152 op 0x1:(WRITE) flags 0x4000 phys_seg 50 prio class 0
[  +0.000014] sd 0:0:0:0: [sda] Read Capacity(16) failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[  +0.000002] sd 0:0:0:0: [sda] Sense not available.
[  +0.000011] EXT4-fs error (device dm-3): ext4_wait_block_bitmap:517: comm kworker/u64:4: Cannot read block bitmap - block_group = 4032, block_bitmap = 132120576
[  +0.000003] sd 0:0:0:0: [sda] tag#9 FAILED Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[  +0.000004] sd 0:0:0:0: [sda] tag#9 CDB: Write(16) 8a 00 00 00 00 00 3e c7 08 00 00 00 08 00 00 00
[  +0.000002] sd 0:0:0:0: [sda] Read Capacity(10) failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[  +0.000003] sd 0:0:0:0: [sda] Sense not available.
[  +0.000003] blk_update_request: I/O error, dev sda, sector 1053231104 op 0x1:(WRITE) flags 0x4000 phys_seg 38 prio class 0
[  +0.000014] sd 0:0:0:0: [sda] 0 512-byte logical blocks: (0 B/0 B)
...

[  +0.000005] Buffer I/O error on device dm-3, logical block 131649373
[  +0.000006] Buffer I/O error on device dm-3, logical block 131649374
[  +0.000004] Buffer I/O error on device dm-3, logical block 131649375
[  +0.000007] Buffer I/O error on device dm-3, logical block 131649376
[  +0.000002] Buffer I/O error on device dm-3, logical block 131649377
[  +0.000002] Buffer I/O error on device dm-3, logical block 131649378
[  +0.000002] Buffer I/O error on device dm-3, logical block 131649379
[  +0.000002] Buffer I/O error on device dm-3, logical block 131649380
...
[  +0.000344] sd 0:0:0:0: [sda] tag#4 access beyond end of device
[  +0.000213] sd 0:0:0:0: [sda] tag#5 access beyond end of device
[  +0.000097] sd 0:0:0:0: [sda] tag#6 access beyond end of device
[  +0.000091] sd 0:0:0:0: [sda] tag#7 access beyond end of device
[  +0.000086] sd 0:0:0:0: [sda] tag#8 access beyond end of device
[  +0.000004] sd 0:0:0:0: [sda] tag#9 access beyond end of device
[  +0.000093] sd 0:0:0:0: [sda] tag#10 access beyond end of device
...
[  +0.000003] sd 0:0:0:0: [sda] tag#6 CDB: ATA command pass through(16) 85 06 2c 00 00 00 00 00 00 00 00 00 00 00 e5 00
[Oct16 06:36] sd 0:0:0:0: [sda] tag#18 FAILED Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[  +0.000002] sd 0:0:0:0: [sda] tag#18 CDB: ATA command pass through(16) 85 06 20 00 00 00 00 00 00 00 00 00 00 00 e5 00
[Oct16 06:46] sd 0:0:0:0: [sda] tag#11 FAILED Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[  +0.000002] sd 0:0:0:0: [sda] tag#11 CDB: ATA command pass through(16) 85 06 20 00 00 00 00 00 00 00 00 00 00 00 e5 00
[Oct16 06:56] sd 0:0:0:0: [sda] tag#19 FAILED Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK

Когда начал проверять все это обнаружил, что диска в системе нет. Он был /dev/sda. Подключен по sata3. Питания с запасом (блок на 650 Вт, суммарно около 300 Вт в пике). БП хороший - seasonic. Перебоев с электричеством не было. Остальные hdd/ssd в порядке. Менять порт пробовал.

Ошибки гуглил, нашел несколько тем, но ничего не понял. Ни причину, ни что делать. Нужен совет всемогущего ЛоРа.


А сейчас, этот диск отображается в системе после перезагрузки? Если нет, то появляются ли хоть какие-то сообщения в dmesg по этому поводу?

SakuraKun ★★★★★
()
Ответ на: комментарий от SakuraKun

Я сейчас на работе, не могу потестить. Приду, дам инфу.

xR41N
() автор топика

Проверь кабель Sata, без шуток. Лучше использовать качественные кабели, которые идут в комплекте с материнскими платами, например. Те кабели, что продаются отдельно в розничных магазинах обычно очень низкого качества, годятся разве что для sata1.

Khnazile ★★★★★
()
Ответ на: комментарий от Khnazile

Смотря какие кабели покупать. У китайцев есть с синей оболочкой (экранирующая «фольга»), так они даже в метровом варианте отлично работают. Правда они стоят дороже 30 рублей, которые обычно готовы отдать за кабель а потом возмущаются.

SakuraKun ★★★★★
()
Ответ на: комментарий от Moderators

Большинство людей, которые не видят разницы между дорогим кабелем и дешёвым, и всегда берут самый дешёвый. Иногда это даже прокатывает.

SakuraKun ★★★★★
()
Ответ на: комментарий от Khnazile

Проверь кабель Sata, без шуток.

Поддерживаю.

Топикстартеру: Ещё хорошо бы проверить SATA-питание и блок питания вообще. Если блок питания старый его лучше заменить.

mord0d ★★★★★
()
Ответ на: комментарий от SakuraKun

Это кабели для промышленного оборудования же. Они по конструкции похожи на SAS-кабели крупных вендоров, только только там проводов меньше, и разъемы соответственно другие.
Ну и ценник хороший, я брал кабель за 550 рублей в последний раз.

Khnazile ★★★★★
()
Ответ на: комментарий от Khnazile

Попробую другой, но кабель комплектный к материнке asus x570. За такую цену он по идее должен быть неплохим.

xR41N
() автор топика
Ответ на: комментарий от Khnazile

https://aliexpress.com/item/4000060458546.html - Для обычных компов тоже подходят, разъёмы у этих кабелей обычный SATA. Правда подорожали немного, я по 100 вроде брал. По-моему, это лучший кабель что есть у китайцев, особенно когда обычных 0.5м не хватает и нужен именно метр.

SakuraKun ★★★★★
()
Последнее исправление: SakuraKun (всего исправлений: 1)
Ответ на: комментарий от Khnazile

Блюсую этого господина болюсом хуато! :-))

На днях чистил комп и получил отвал диска. Пришлось разбирать всё взад и передергивать кабеля. Взлетело, как и было.

anonymous
()
Ответ на: комментарий от xR41N

Мог быть заводской брак или просто рассохся, и поэтому может не выдавать заявленного напряжения, потому его может не хватить.

mord0d ★★★★★
()
Ответ на: комментарий от Moderators

Никогда) Потому что в DNS c наценками будет минимум 300, а народ за такие деньги не купит. Например, в онлайн трейде набор из 4 длинных кабелей за 900 - больше 200 за кабель, и то не метровые. Поэтому такие вещи только с алиэкспресса ждать.

SakuraKun ★★★★★
()
Последнее исправление: SakuraKun (всего исправлений: 1)
Ответ на: комментарий от Moderators

мешает розничным сетям завозить качественные кабеля

где ты был последние 29 лет? жажда наживы мещает - завозят говно, а выдают их за суперские, ну и ценник соответствующий…

anonymous
()
Ответ на: комментарий от SakuraKun

в DNS

переходник DVI-D стоит 999 рублей, а на али 111, можно и дешевле найти, но тогда доставка платная…

anonymous
()
Ответ на: комментарий от anonymous

В куче городов ДНС сейчас монополист в плане «пойти купить в розницу, здесь и сейчас», могут себе позволить.

Khnazile ★★★★★
()
Ответ на: комментарий от SakuraKun

Ребутался, пробовал с другим кабелем и даже бп старый поставил - все одно.

Запустил ту же операцию по копированию. Сейчас ошибка другая, но в dmesg тоже самое

rsync -ah --info=progress2 /mnt/storage1/media/ /mnt/media-11Tb/media/
        625.96G  26%  221.00MB/s    2:07:22  #194, ir-chk=1003/2148)
rsync: write failed on "/mnt/media-11Tb/media/records/home/2020-06-21.mkv": Read-only file system (30)
rsync error: error in file IO (code 11) at receiver.c(374) [receiver=3.1.3]
[  +0.000001] EXT4-fs (dm-3): This should not happen!! Data will be lost

[  +0.000023] sd 0:0:0:0: [sda] tag#25 access beyond end of device
[  +0.000004] sd 0:0:0:0: [sda] tag#26 access beyond end of device
[  +0.000213] sd 0:0:0:0: [sda] tag#27 access beyond end of device
[  +0.000004] sd 0:0:0:0: [sda] tag#28 access beyond end of device
[  +0.000508] sd 0:0:0:0: [sda] tag#29 access beyond end of device
[  +0.000008] sd 0:0:0:0: [sda] tag#30 access beyond end of device
[  +0.000041] sd 0:0:0:0: [sda] tag#0 access beyond end of device
[  +0.000010] sd 0:0:0:0: [sda] tag#1 access beyond end of device
[  +0.000042] sd 0:0:0:0: [sda] tag#2 access beyond end of device
[  +0.000007] sd 0:0:0:0: [sda] tag#3 access beyond end of device
[  +0.000225] sd 0:0:0:0: [sda] tag#4 access beyond end of device
[  +0.000043] sd 0:0:0:0: [sda] tag#5 access beyond end of device
[  +0.000015] sd 0:0:0:0: [sda] tag#6 access beyond end of device
[  +0.000871] sd 0:0:0:0: [sda] tag#7 access beyond end of device
[  +0.000144] sd 0:0:0:0: [sda] tag#8 access beyond end of device
[  +0.000006] sd 0:0:0:0: [sda] tag#9 access beyond end of device
[  +0.000034] sd 0:0:0:0: [sda] tag#10 access beyond end of device
[  +0.000005] sd 0:0:0:0: [sda] tag#11 access beyond end of device
[  +0.000042] sd 0:0:0:0: [sda] tag#12 access beyond end of device
[  +0.000005] sd 0:0:0:0: [sda] tag#13 access beyond end of device
[  +0.000037] sd 0:0:0:0: [sda] tag#14 access beyond end of device
[  +0.000368] sd 0:0:0:0: [sda] tag#15 access beyond end of device
[  +0.000096] sd 0:0:0:0: [sda] tag#16 access beyond end of device
[  +0.000006] sd 0:0:0:0: [sda] tag#17 access beyond end of device
[  +0.000116] sd 0:0:0:0: [sda] tag#18 access beyond end of device
[  +0.000119] sd 0:0:0:0: [sda] tag#19 access beyond end of device
[  +0.000006] sd 0:0:0:0: [sda] tag#20 access beyond end of device
[  +0.000030] sd 0:0:0:0: [sda] tag#21 access beyond end of device
[  +0.000007] sd 0:0:0:0: [sda] tag#22 access beyond end of device
[  +0.000055] sd 0:0:0:0: [sda] tag#23 access beyond end of device
[  +0.000023] sd 0:0:0:0: [sda] tag#31 access beyond end of device
[  +0.000026] sd 0:0:0:0: [sda] tag#0 access beyond end of device
[  +0.000005] sd 0:0:0:0: [sda] tag#1 access beyond end of device
[  +0.000240] sd 0:0:0:0: [sda] tag#2 access beyond end of device
[  +0.000301] sd 0:0:0:0: [sda] tag#3 access beyond end of device
[  +0.000125] JBD2: Detected IO errors while flushing file data on dm-3-8
[  +0.000006] Aborting journal on device dm-3-8.
[  +0.000022] sd 0:0:0:0: [sda] tag#4 access beyond end of device
[  +0.000002] Buffer I/O error on dev dm-3, logical block 1464369152, lost sync page write
[  +0.000002] JBD2: Error -5 detected when updating journal superblock for dm-3-8.
[  +0.001038] sd 0:0:0:0: [sda] tag#5 access beyond end of device
[  +0.000003] Buffer I/O error on dev dm-3, logical block 0, lost sync page write
[  +0.000004] EXT4-fs (dm-3): I/O error while writing superblock
[  +0.000003] EXT4-fs error (device dm-3): ext4_journal_check_start:61: Detected aborted journal
[  +0.000001] EXT4-fs (dm-3): Remounting filesystem read-only
[  +0.000014] sd 0:0:0:0: [sda] tag#6 access beyond end of device
[  +0.000002] Buffer I/O error on dev dm-3, logical block 0, lost sync page write
[  +0.000001] EXT4-fs (dm-3): I/O error while writing superblock
[ +22.195575] program smartctl is using a deprecated SCSI ioctl, please convert it to SG_IO
[  +0.000010] program smartctl is using a deprecated SCSI ioctl, please convert it to SG_IO
[  +0.000004] program smartctl is using a deprecated SCSI ioctl, please convert it to SG_IO
[  +3.729016] program smartctl is using a deprecated SCSI ioctl, please convert it to SG_IO
[  +0.000008] program smartctl is using a deprecated SCSI ioctl, please convert it to SG_IO
[  +0.000004] program smartctl is using a deprecated SCSI ioctl, please convert it to SG_IO
[  +7.539419] program smartctl is using a deprecated SCSI ioctl, please convert it to SG_IO
[  +0.000012] program smartctl is using a deprecated SCSI ioctl, please convert it to SG_IO
[  +0.000005] program smartctl is using a deprecated SCSI ioctl, please convert it to SG_IO

Диск опять пропал. Последний смарт

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   132   132   054    Pre-fail  Offline      -       96
  3 Spin_Up_Time            0x0007   100   100   024    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       1
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   140   140   020    Pre-fail  Offline      -       15
  9 Power_On_Hours          0x0012   100   100   000    Old_age   Always       -       125
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       1
 22 Helium_Level            0x0023   100   100   025    Pre-fail  Always       -       100
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       9
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       9
194 Temperature_Celsius     0x0002   153   153   000    Old_age   Always       -       39 (Min/Max 25/42)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0

Я вот думаю, мб это из-за каких-то ограничений ext4? Слишком большой раздел? Или блоки неудачного размера?

xR41N
() автор топика
Ответ на: комментарий от xR41N

Тогда ФС просто уходила бы в ro, но целый диск не исчезал бы.

Если кабели заменены, и SATA-порт тоже, то можно для верности прогнать memtest. Потом взять другой SATA-контроллер. Или вместо всего этого просто подключить к другому ПК и запустить rsync на нём.

gag ★★★★★
()
Ответ на: комментарий от gag

memtest я проводил месяц назад, когда комп апгрейдил. Три дня почти гонял, ошибок не было. С другим пк пока вариантов нету, дома кроме основного пк только ноут. На работе не дадут.

xR41N
() автор топика
Ответ на: комментарий от xR41N

Около 6-8 лет назад у ноутов один из USB портов был комбинирован с eSATA. Хорошая была мода.

gag ★★★★★
()
Ответ на: комментарий от xR41N

Вот кстати плюсуя анона, BIOS/UEFI этот диск видит? Любой другой диск цепляется? Вполне возможно, что SATA-контроллер или весь южный мост умирает.

SkyMaverick ★★★★★
()
Ответ на: комментарий от xR41N

Сообщение «access beyond end of device» свидетельствует о том, что ext4 имеет существенные ошибки. Первопричина, судя по всему, отключение диска по SATA.

Например у меня было как-то: вибрация самого диска передавалась по кабелю SATA и дребезг контакта происходил на разъёме SATA на плате. Месяц искал, шнуры менял без результа, пока не понял.

Типичное проявление было: как только даёшь большую нагрузку, тут же отваливался, при малой нагрузке работал нормально.

Попробуйте прификсировать шнурок SATA к корпусу.

anonymous
()
Ответ на: комментарий от SkyMaverick

Да, биос видит диск. Любой диск цепляется по этому порту и на этот провод. У меня 3 хдд и 2 ссд. Все работают.

xR41N
() автор топика
Ответ на: комментарий от anonymous

Вообще защелки на проводах хорошо держат. Синий изолентой дополнительно этот диск примотал и к кабелю питания, и к сата кабелю. Даже на другой дистрибутив зашел, чтобы исключить программные ошибки. Запустил копирование. Жду результатов.

xR41N
() автор топика
Ответ на: комментарий от SakuraKun

Кто хоть немножечко понимает, чего ждать от подвального noname кабеля - купит.

Moderators ★★
()
Ответ на: комментарий от xR41N

кроме кабеля может элементарно управляющая электроника перегреваться («плата/контроллер») – всё-таки он не один час интенсивно работал.

anonymous
()
Ответ на: комментарий от anonymous

По sensors все температуры в порядке. На матери куча радиаторов и над южным мостом кулер установлен.

Прошло больше часа копирования после оборачивания волшебной изолентой и смены дистрибутива. Пока все в норме. Раньше отваливалось в первые 10-15 минут.

xR41N
() автор топика
Ответ на: комментарий от xR41N

я больше на плату диска думал…

Прошло больше часа копирования после оборачивания волшебной изолентой и смены дистрибутива. Пока все в норме. Раньше отваливалось в первые 10-15 минут.

это хорошо. видимо, действительно плохой кабель/контакт.

anonymous
()

HDD «исчез» при копировании

Вам нужно обратиться в 02.

Ваш диск спи*дили...

Владимир

anonymous
()

До последнего думал что тут дело в кабеле. Отвал диска - это их тема. Подписался.

tommy ★★★★★
()
Ответ на: комментарий от tommy

Судя по всему проблема все же не аппаратная. Закончилось копирование, проблем не возникло. Это все происходило на арче. Переключился обратно на убунту и запустил копирование, но других файлов на 1,5 Тб. Диск отвалился через 2 минуты. Переключился на арч. Копирование прошло нормально. Че то каноникалы в 20.04.1 сделали не так…

xR41N
() автор топика
Ответ на: комментарий от xR41N

Для статистики будет неплохо зафиксировать точное наименование ядер.

gag ★★★★★
()
Ответ на: комментарий от xR41N

В следующий раз пробуй Gparted с переносом раздела диска.

anonymous
()
Ответ на: комментарий от SakuraKun

Оно конечно можно все на людей, которые покупают свалить. Однако, человек приходит в магазин, видит кабель, на нем написано sata 3 кабель, вот зачем ему будучи рациональным существом покупать более дорогой? Он покупает, а по факту оказывается, что кабель не соответствует заявленной спецификации. Он идёт в магазин ему там или меняют кабель с доплатой на более дорогой или говорят «ну а что вы хотели, вы же видите сколько он стоит?» Снимет ли магазин с продажи партию некачественного товара? Сомнительно

cobold ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.