LINUX.ORG.RU

2 внешних диска: непонятное событие -> «все пропало»

 , , ,


0

2

2 внешних диска (hdd, usb2.0/3.0, питание отдельно от розетки через адаптер) с похожими симптомами: перестали монтироваться после некоторого непонятного события.

WD - 2Tb, usb 3.0. Отформатирован из Windows 7 - gpt: маленький раздел «зарезервировано Microsoft» (или как-то так) не помню в чем, большой раздел с данными в ntfs. Segate - 1Tb, usb2.0, mbr, ntfs (чем отформатирован - уже не помню, давно было).

Linux Mint 19.1 tessa, Caja 1.20.2

$ lsb_release -a
No LSB modules are available.
Distributor ID:	LinuxMint
Description:	Linux Mint 19.1 Tessa
Release:	19.1
Codename:	tessa
$ uname -a
Linux workstation 4.15.0-74-generic #84-Ubuntu SMP Thu Dec 19 08:06:28 UTC 2019 x86_64 x86_64 x86_64 GNU/Linux

При копировании на WD (по usb3.0) из Caja 20Gb данных процесс внезапно намертво повис и никак не отвисал. Пришлось выдернуть usb-хвост (питание осталось). После перезагрузки диск не монтируется и при подключении usb индикатор вяло мигает пару раз - и все. С Segate после этого «странного события» и перезагрузки все то же самое - только вот сразу при подключении, безо всякого копирования (несколькими днями ранее с ним точно все было в порядке, он весь, по крайней мере, читался).

При попытке смонтировать (на другой машине) SpaceFM ругнулся:

Error mounting /dev/sdb1: GDBus.Error:org.freedesktop.UDisks2.Error.Failed: Error mounting /dev/sdb1 at /media/username/1Tb-Segate: Command-line `mount -t "ntfs" -o "uhelper=udisks2,nodev,nosuid,uid=1000,gid=1000,noexec,nosuid,noatime" "/dev/sdb1" "/media/username/1Tb-Segate"' exited with non-zero exit status 13: $MFTMirr does not match $MFT (record 0).
Failed to mount '/dev/sdb1': Ошибка ввода/вывода
NTFS is either inconsistent, or there is a hardware fault, or it's a
SoftRAID/FakeRAID hardware. In the first case run chkdsk /f on Windows
then reboot into Windows twice. The usage of the /f parameter is very
important! If the device is a SoftRAID/FakeRAID then first activate
it and mount a different device under the /dev/mapper/ directory, (e.g.
/dev/mapper/nvidia_eahaabcc1). Please see the 'dmraid' documentation
for more details.

Последовать доброму совету «run chkdsk /f on Windows then reboot into Windows twice» как-то боязно - мне очень ценны эти данные. Так что пока вытягиваю testdisk-ом (с WD вытянулось, с Segate в процессе) - «по живому без анестезии», ибо образ снять просто некуда.

Segate
# dmesg
[  138.599483] usb-storage 2-1:1.0: USB Mass Storage device detected
[  138.599571] usb-storage 2-1:1.0: Quirks match for vid 152d pid 2329: 8020
[  138.599633] scsi host3: usb-storage 2-1:1.0
[  138.599720] usbcore: registered new interface driver usb-storage
[  138.613741] usbcore: registered new interface driver uas
[  139.626435] scsi 3:0:0:0: Direct-Access     ST1000DL 002-9TT153            PQ: 0 ANSI: 2 CCS
[  139.627681] sd 3:0:0:0: Attached scsi generic sg1 type 0
[  139.627864] sd 3:0:0:0: [sdb] 1953525168 512-byte logical blocks: (1.00 TB/932 GiB)
[  139.628082] sd 3:0:0:0: [sdb] Write Protect is off
[  139.628087] sd 3:0:0:0: [sdb] Mode Sense: 28 00 00 00
[  139.628308] sd 3:0:0:0: [sdb] No Caching mode page found
[  139.628313] sd 3:0:0:0: [sdb] Assuming drive cache: write through
[  139.643039]  sdb: sdb1
[  139.644039] sd 3:0:0:0: [sdb] Attached SCSI disk
[  142.724942] fuse init (API version 7.26)

# fdisk
Disk /dev/sdb: 931,5 GiB, 1000204886016 bytes, 1953525168 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: dos
Disk identifier: 0x4498398d

Device     Boot Start        End    Sectors   Size Id Type
/dev/sdb1          63 1953520064 1953520002 931,5G  7 HPFS/NTFS/exFAT

Очень хотелось бы знать:

  • Что же произошло (почему это самое случилось с дисками)?
  • Что именно случилось с дисками?
  • Самое главное - как избежать повторения этой дивной ситуации?

Я не знаю, что еще нужно добавить, чтобы прояснить ситуацию. Уверена, что многого не хватает - пожалуйста, скажите мне об этом, сама я не догадаюсь.



Последнее исправление: blondy (всего исправлений: 2)

Что же произошло (почему это самое случилось с дисками)?

Это надо было смотреть логи на момент сбоя. Ищи файлы /var/log/dmesg* или через journalctl -dmesg.

legolegs ★★★★★
()
Ответ на: комментарий от blondy

на машине, которая тащит данные нельзя выполнить smartctl --all /dev/sd...?

Вообще-то это первое, что надо смотреть при сбое диска.

legolegs ★★★★★
()
Ответ на: комментарий от blondy

Есть программка для просмотра логов, у неё можно запросить записи по дате и времени.

journalctl --since="2019-12-01 03:00" --until="2019-12-01 12:00" _TRANSPORT=kernel
legolegs ★★★★★
()
Последнее исправление: legolegs (всего исправлений: 1)
Ответ на: комментарий от blondy

А WD чем занят, что его SMART'а тоже нет? И ещё посмотрите ″smartctl -l scttemp″, чтобы понять, что с температурами было.

mky ★★★★★
()
Ответ на: комментарий от legolegs

Спасибо! Там гигантская простыня (и куча вопросов по ходу, к теме прямо не относящихся) за несколько дней (точный момент никто же не засекал, как обычно), это займет некоторое время.

blondy
() автор топика
Ответ на: комментарий от mky

smartctl –all /dev/sdh

smartctl 7.0 2018-12-30 r4883 [x86_64-linux-4.15.0-74-generic] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     WDC WD20PURZ-85GU6Y0
Serial Number:    WD-WCC4M5DLDC05
LU WWN Device Id: 5 0014ee 20f91dd02
Firmware Version: 80.00A80
User Capacity:    2 000 398 934 016 bytes [2,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Sun Jan 19 15:06:55 2020 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Status not supported: Incomplete response, ATA output registers missing
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(27060) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 273) minutes.
Conveyance self-test routine
recommended polling time: 	 (   5) minutes.
SCT capabilities: 	       (0x703d)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   178   177   021    Pre-fail  Always       -       4083
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       170
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       1030
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       42
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       2
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       167
194 Temperature_Celsius     0x0022   120   103   000    Old_age   Always       -       27
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

smartctl -l scttemp /dev/sdh

smartctl 7.0 2018-12-30 r4883 [x86_64-linux-4.15.0-74-generic] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SCT Status Version:                  3
SCT Version (vendor specific):       258 (0x0102)
Device State:                        Active (0)
Current Temperature:                    27 Celsius
Power Cycle Min/Max Temperature:     23/27 Celsius
Lifetime    Min/Max Temperature:     19/44 Celsius
Under/Over Temperature Limit Count:   0/0
Vendor specific:
01 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00

SCT Temperature History Version:     2
Temperature Sampling Period:         1 minute
Temperature Logging Interval:        1 minute
Min/Max recommended Temperature:      0/60 Celsius
Min/Max Temperature Limit:           -41/85 Celsius
Temperature History Size (Index):    478 (407)

Index    Estimated Time   Temperature Celsius
 408    2020-01-19 07:10    40  *********************
 ...    ..(462 skipped).    ..  *********************
 393    2020-01-19 14:53    40  *********************
 394    2020-01-19 14:54     ?  -
 395    2020-01-19 14:55    25  ******
 396    2020-01-19 14:56     ?  -
 397    2020-01-19 14:57    23  ****
 398    2020-01-19 14:58    23  ****
 399    2020-01-19 14:59    24  *****
 ...    ..(  2 skipped).    ..  *****
 402    2020-01-19 15:02    24  *****
 403    2020-01-19 15:03    25  ******
 404    2020-01-19 15:04    25  ******
 405    2020-01-19 15:05    26  *******
 406    2020-01-19 15:06    27  ********
 407    2020-01-19 15:07    27  ********
blondy
() автор топика
Ответ на: комментарий от blondy

Диск в порядке. Даже не перегревается. Сбой был скорее всего из-за плохого питания, такое случается. Ну или лог ядра может что-то выявить. Может драйвер ntfs сбойнул.

legolegs ★★★★★
()
Ответ на: комментарий от blondy

По smart'у всё хорошо, можно, наверное, сделать long self-test, но думаю, что он пройдёт успешно. Скорее всего, у seagate тоже всё ОК.

Могу дать такие ответы на вопросы из стартового поста.

1. Внезапно прервалась связь в момент записи на ФС. Отключенный и заново подклченный диск это уже другое устройство с точки зрения ОС, поэтому данные не записались и были потеряны. Файловая система оказалась в нечитаемом состоянии. Так как ntfs, то её и советуют «лечить» под виндой.

2. Почему это произошло достоверно не определить. ИМХО, была помеха по питанию и разные блоки питания, где-то возник слишком большая разница напряжний и что-то зависло, может контроллер USB в компе, может контроллер, преобразующий USB в SATA.

3. Как избежать повторения ситуации типа «Винт отказал, данные на нём пропали»? Если бы кто знал, как сделать, чтобы бы диски работали вечно... Данные защищают резервным копированием и регулярной проверкой правильности резервных копий, а накопители сколько-то работают, а потом умирают, часто внезапно.

Если бы у вас где-то была бы резервная копия, могли бы с винтом сделать ″chkdsk /f″, вполне вероятно, что только эти 20 Гб записываемых данных испортились бы.

mky ★★★★★
()
Ответ на: комментарий от legolegs

Часть журнала - в «день зависшего копирования». Если верить журналу, то я ошиблась - сначала не подключился Segate, а затем зависло копирование на WD. Очень длинная простыня - 1.

Попытка подключить Segate

янв 16 13:54:07 workstation kernel: usb 1-2: new high-speed USB device number 9 using xhci_hcd
янв 16 13:54:08 workstation kernel: usb 1-2: New USB device found, idVendor=152d, idProduct=2329
янв 16 13:54:08 workstation kernel: usb 1-2: New USB device strings: Mfr=1, Product=2, SerialNumber=5
янв 16 13:54:08 workstation kernel: usb 1-2: Product: USB to ATA/ATAPI bridge
янв 16 13:54:08 workstation kernel: usb 1-2: Manufacturer: JMicron
янв 16 13:54:08 workstation kernel: usb 1-2: SerialNumber: 1017FFFFFFFF
янв 16 13:54:08 workstation kernel: usb-storage 1-2:1.0: USB Mass Storage device detected
янв 16 13:54:08 workstation kernel: usb-storage 1-2:1.0: Quirks match for vid 152d pid 2329: 8020
янв 16 13:54:08 workstation kernel: scsi host9: usb-storage 1-2:1.0
янв 16 13:54:08 workstation mtp-probe[9943]: checking bus 1, device 9: "/sys/devices/pci0000:00/0000:00:14.0/usb1/1-2"
янв 16 13:54:08 workstation mtp-probe[9943]: bus: 1, device: 9 was not an MTP device
янв 16 13:54:08 workstation upowerd[3016]: unhandled action 'bind' on /sys/devices/pci0000:00/0000:00:14.0/usb1/1-2/1-2:1.0
янв 16 13:54:08 workstation upowerd[3016]: unhandled action 'bind' on /sys/devices/pci0000:00/0000:00:14.0/usb1/1-2
янв 16 13:54:09 workstation kernel: scsi 9:0:0:0: Direct-Access     ST1000DL 002-9TT153            PQ: 0 ANSI: 2 CCS
янв 16 13:54:09 workstation kernel: sd 9:0:0:0: Attached scsi generic sg8 type 0
янв 16 13:54:09 workstation kernel: sd 9:0:0:0: [sdh] 1953525168 512-byte logical blocks: (1.00 TB/932 GiB)
янв 16 13:54:09 workstation kernel: sd 9:0:0:0: [sdh] Write Protect is off
янв 16 13:54:09 workstation kernel: sd 9:0:0:0: [sdh] Mode Sense: 28 00 00 00
янв 16 13:54:09 workstation kernel: sd 9:0:0:0: [sdh] No Caching mode page found
янв 16 13:54:09 workstation kernel: sd 9:0:0:0: [sdh] Assuming drive cache: write through
янв 16 13:54:09 workstation kernel:  sdh: sdh1
янв 16 13:54:09 workstation kernel: sd 9:0:0:0: [sdh] Attached SCSI disk
янв 16 13:54:09 workstation udisksd[1230]: Error performing initial housekeeping for drive /org/freedesktop/UDisks2/drives/ST1000DL002_9TT153_S1V01G7S: Error updating SMART SegateDrive: sk_disk_smart_read_SegateDrive: Operation not supported (udisks-error-quark, 0)

янв 16 13:54:09 workstation udisksd[1230]: $MFTMirr does not match $MFT (record 0).
янв 16 13:54:09 workstation udisksd[1230]: Failed to mount '/dev/sdh1': Ошибка ввода/вывода
янв 16 13:54:09 workstation udisksd[1230]: NTFS is either inconsistent, or there is a hardware fault, or it's a
янв 16 13:54:09 workstation udisksd[1230]: SoftRAID/FakeRAID hardware. In the first case run chkdsk /f on Windows
янв 16 13:54:09 workstation udisksd[1230]: then reboot into Windows twice. The usage of the /f parameter is very
янв 16 13:54:09 workstation udisksd[1230]: important! If the device is a SoftRAID/FakeRAID then first activate
янв 16 13:54:09 workstation udisksd[1230]: it and mount a different device under the /dev/mapper/ directory, (e.g.
янв 16 13:54:09 workstation udisksd[1230]: /dev/mapper/nvidia_eahaabcc1). Please see the 'dmraid' documentation
янв 16 13:54:09 workstation udisksd[1230]: for more details.
янв 16 13:54:09 workstation udisksd[1230]: Failed to setup systemd-based mount point cleanup: Process reported exit code 5: Failed to start clean-mount-point@media-username-DATA\x2d1Tb\x2dSegate.service: Unit media-username-DATA\x2d1Tb\x2dSegate.mount not found.
янв 16 13:54:09 workstation udisksd[1230]: Mounted /dev/sdh1 at /media/username/DATA-1Tb-Segate on behalf of uid 1000
янв 16 13:54:09 workstation udisksd[1230]: Cleaning up mount point /media/username/DATA-1Tb-Segate (device 8:113 is not mounted)

янв 16 13:54:13 workstation udisksd[1230]: $MFTMirr does not match $MFT (record 0).
# полный повтор как в куске выше, один в один, только время другое
янв 16 13:54:13 workstation udisksd[1230]: Cleaning up mount point /media/username/DATA-1Tb-Segate (device 8:113 is not mounted) 
янв 16 13:54:14 workstation udisksd[1230]: $MFTMirr does not match $MFT (record 0). # --//--
янв 16 13:54:14 workstation udisksd[1230]: $MFTMirr does not match $MFT (record 0). # --//--
янв 16 13:54:22 workstation udisksd[1230]: $MFTMirr does not match $MFT (record 0). # --//--
янв 16 13:54:23 workstation udisksd[1230]: $MFTMirr does not match $MFT (record 0). # --//--
янв 16 13:54:35 workstation udisksd[1230]: $MFTMirr does not match $MFT (record 0). # --//--
янв 16 13:54:35 workstation udisksd[1230]: $MFTMirr does not match $MFT (record 0). # --//--
янв 16 13:54:37 workstation udisksd[1230]: $MFTMirr does not match $MFT (record 0). # --//--
янв 16 13:54:39 workstation udisksd[1230]: $MFTMirr does not match $MFT (record 0). # --//--
янв 16 13:54:46 workstation udisksd[1230]: $MFTMirr does not match $MFT (record 0). # --//--
янв 16 13:54:46 workstation udisksd[1230]: Cleaning up mount point /media/username/DATA-1Tb-Segate (device 8:113 is not mounted)
янв 16 13:54:48 workstation udisksd[1230]: Successfully sent SCSI command SYNCHRONIZE CACHE to /dev/sdh
янв 16 13:54:49 workstation udisksd[1230]: Successfully sent SCSI command START STOP UNIT to /dev/sdh
янв 16 13:54:49 workstation udisksd[1230]: Powered off /dev/sdh - successfully wrote to sysfs path /sys/devices/pci0000:00/0000:00:14.0/usb1/1-2/remove
янв 16 13:54:49 workstation upowerd[3016]: unhandled action 'unbind' on /sys/devices/pci0000:00/0000:00:14.0/usb1/1-2/1-2:1.0
янв 16 13:54:49 workstation kernel: usb 1-2: USB disconnect, device number 9
янв 16 13:54:49 workstation kernel: caja[2922]: segfault at 4 ip 00005633bd3125a4 sp 00007ffd46ed8fa0 error 4 in caja[5633bd2a1000+1cf000]
янв 16 13:54:49 workstation upowerd[3016]: unhandled action 'unbind' on /sys/devices/pci0000:00/0000:00:14.0/usb1/1-2

янв 16 13:55:02 workstation kernel: usb 1-2: new high-speed USB device number 10 using xhci_hcd
# метод "выключить и снова включить" - с тем же результатом
янв 16 13:56:13 workstation kernel: usb 1-2: USB disconnect, device number 10
янв 16 13:56:13 workstation kernel: caja[10098]: segfault at 4 ip 000055fe69d3c5a4 sp 00007fff281ec460 error 4 in caja[55fe69ccb000+1cf000]
янв 16 13:56:13 workstation upowerd[3016]: unhandled action 'unbind' on /sys/devices/pci0000:00/0000:00:14.0/usb1/1-2
blondy
() автор топика
Ответ на: комментарий от blondy

Очень длинная простыня - 2.

WD - зависшее копирование: https://paste.ubuntu.com/p/mM3b6FWz33/ (оно слишком большое даже с сокращениями).

WD после перезагрузки:

...
янв 16 15:31:25 workstation kernel: usb 2-2: new SuperSpeed USB device number 2 using xhci_hcd
янв 16 15:31:25 workstation kernel: usb 2-2: New USB device found, idVendor=4971, idProduct=8017
янв 16 15:31:25 workstation kernel: usb 2-2: New USB device strings: Mfr=1, Product=2, SerialNumber=3
янв 16 15:31:25 workstation kernel: usb 2-2: Product: USB to ATA/ATAPI Bridge
янв 16 15:31:25 workstation kernel: usb 2-2: Manufacturer: JMicron
янв 16 15:31:25 workstation kernel: usb 2-2: SerialNumber: 111122223333
янв 16 15:31:25 workstation kernel: scsi host9: uas
янв 16 15:31:25 workstation kernel: scsi 9:0:0:0: Direct-Access     WDC WD20 PURZ-85GU6Y0     8104 PQ: 0 ANSI: 6
янв 16 15:31:25 workstation kernel: sd 9:0:0:0: Attached scsi generic sg8 type 0
янв 16 15:31:25 workstation kernel: sd 9:0:0:0: [sdh] Spinning up disk...
янв 16 15:31:25 workstation mtp-probe[2921]: checking bus 2, device 2: "/sys/devices/pci0000:00/0000:00:14.0/usb2/2-2"
янв 16 15:31:25 workstation mtp-probe[2921]: bus: 2, device: 2 was not an MTP device
янв 16 15:31:25 workstation upowerd[2286]: unhandled action 'bind' on /sys/devices/pci0000:00/0000:00:14.0/usb2/2-2/2-2:1.0
янв 16 15:31:25 workstation upowerd[2286]: unhandled action 'bind' on /sys/devices/pci0000:00/0000:00:14.0/usb2/2-2
янв 16 15:31:26 workstation kernel: .
янв 16 15:31:26 workstation kernel: ready
янв 16 15:31:26 workstation kernel: sd 9:0:0:0: [sdh] 3907029168 512-byte logical blocks: (2.00 TB/1.82 TiB)
янв 16 15:31:26 workstation kernel: sd 9:0:0:0: [sdh] 4096-byte physical blocks
янв 16 15:31:26 workstation kernel: sd 9:0:0:0: [sdh] Write Protect is off
янв 16 15:31:26 workstation kernel: sd 9:0:0:0: [sdh] Mode Sense: 53 00 00 08
янв 16 15:31:26 workstation kernel: sd 9:0:0:0: [sdh] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
янв 16 15:31:26 workstation kernel: sd 9:0:0:0: [sdh] Optimal transfer size 33553920 bytes not a multiple of physical block size (4096 bytes)
янв 16 15:31:26 workstation kernel:  sdh: sdh1 sdh2
янв 16 15:31:26 workstation kernel: sd 9:0:0:0: [sdh] Attached SCSI disk
янв 16 15:31:27 workstation udisksd[1273]: $MFTMirr does not match $MFT (record 0).
янв 16 15:31:27 workstation udisksd[1273]: Failed to mount '/dev/sdh2': Ошибка ввода/вывода
янв 16 15:31:27 workstation udisksd[1273]: NTFS is either inconsistent, or there is a hardware fault, or it's a
янв 16 15:31:27 workstation udisksd[1273]: SoftRAID/FakeRAID hardware. In the first case run chkdsk /f on Windows
янв 16 15:31:27 workstation udisksd[1273]: then reboot into Windows twice. The usage of the /f parameter is very
янв 16 15:31:27 workstation udisksd[1273]: important! If the device is a SoftRAID/FakeRAID then first activate
янв 16 15:31:27 workstation udisksd[1273]: it and mount a different device under the /dev/mapper/ directory, (e.g.
янв 16 15:31:27 workstation udisksd[1273]: /dev/mapper/nvidia_eahaabcc1). Please see the 'dmraid' documentation
янв 16 15:31:27 workstation udisksd[1273]: for more details.
янв 16 15:31:27 workstation udisksd[1273]: Failed to setup systemd-based mount point cleanup: Process reported exit code 5: Failed to start clean-mount-point@media-username-WD\x2Username.service: Unit media-username-WD\x2dUsername.mount not found.
янв 16 15:31:27 workstation udisksd[1273]: Mounted /dev/sdh2 at /media/username/WD-Username on behalf of uid 1000
янв 16 15:31:27 workstation udisksd[1273]: Cleaning up mount point /media/username/WD-Username (device 8:114 is not mounted)
...
янв 16 15:31:44 workstation udisksd[1273]: $MFTMirr does not match $MFT (record 0).
янв 16 15:31:44 workstation udisksd[1273]: Failed to mount '/dev/sdh2': Ошибка ввода/вывода
янв 16 15:31:44 workstation udisksd[1273]: NTFS is either inconsistent, or there is a hardware fault, or it's a
янв 16 15:31:44 workstation udisksd[1273]: SoftRAID/FakeRAID hardware. In the first case run chkdsk /f on Windows
янв 16 15:31:44 workstation udisksd[1273]: then reboot into Windows twice. The usage of the /f parameter is very
янв 16 15:31:44 workstation udisksd[1273]: important! If the device is a SoftRAID/FakeRAID then first activate
янв 16 15:31:44 workstation udisksd[1273]: it and mount a different device under the /dev/mapper/ directory, (e.g.
янв 16 15:31:44 workstation udisksd[1273]: /dev/mapper/nvidia_eahaabcc1). Please see the 'dmraid' documentation
янв 16 15:31:44 workstation udisksd[1273]: for more details.
янв 16 15:31:44 workstation udisksd[1273]: Failed to setup systemd-based mount point cleanup: Process reported exit code 5: Failed to start clean-mount-point@media-username-WD\x2Username.service: Unit media-username-WD\x2dUsername.mount not found.
янв 16 15:31:44 workstation udisksd[1273]: Mounted /dev/sdh2 at /media/username/WD-Username on behalf of uid 1000
янв 16 15:31:44 workstation udisksd[1273]: Cleaning up mount point /media/username/WD-Username (device 8:114 is not mounted)

янв 16 15:31:44 workstation udisksd[1273]: $MFTMirr does not match $MFT (record 0). # --//--
янв 16 15:32:10 workstation udisksd[1273]: $MFTMirr does not match $MFT (record 0). # --//--
янв 16 15:32:23 workstation udisksd[1273]: $MFTMirr does not match $MFT (record 0). # --//--
янв 16 15:32:23 workstation udisksd[1273]: Cleaning up mount point /media/username/WD-Username (device 8:114 is not mounted)

янв 16 15:32:23 workstation udisksd[1273]: Failed to setup systemd-based mount point cleanup: Process reported exit code 5: Failed to start clean-mount-point@media-username-WD\x2Username.service: Unit media-username-WD\x2dUsername.mount not found.
янв 16 15:32:23 workstation udisksd[1273]: Mounted /dev/sdh2 at /media/username/WD-Username1 on behalf of uid 1000
янв 16 15:33:21 workstation kernel: usb 2-2: USB disconnect, device number 2
янв 16 15:33:21 workstation kernel: sd 9:0:0:0: [sdh] Synchronizing SCSI cache
янв 16 15:33:21 workstation udisksd[1273]: Cleaning up mount point /media/username/WD-Username1 (device 8:114 no longer exists)
янв 16 15:33:21 workstation kernel: sd 9:0:0:0: [sdh] Synchronize Cache(10) failed: Result: hostbyte=DID_ERROR driverbyte=DRIVER_OK
янв 16 15:33:21 workstation upowerd[2286]: unhandled action 'unbind' on /sys/devices/pci0000:00/0000:00:14.0/usb2/2-2/2-2:1.0
янв 16 15:33:21 workstation upowerd[2286]: unhandled action 'unbind' on /sys/devices/pci0000:00/0000:00:14.0/usb2/2-2
... # etc ...
blondy
() автор топика
Ответ на: комментарий от blondy
$MFTMirr does not match $MFT (record 0).
Failed to mount '/dev/sdh1': Ошибка ввода/вывода
NTFS is either inconsistent, or there is a hardware fault, or it's a
SoftRAID/FakeRAID hardware. In the first case run chkdsk /f on Windows
then reboot into Windows twice. The usage of the /f parameter is very
important!

Что из этого не понятно?

Radjah ★★★★★
()
Ответ на: комментарий от Radjah

Что из этого не понятно?

ТС задаёт русским языком понятный вопрос:

Очень хотелось бы знать: Что же произошло (почему это самое случилось с дисками)?

legolegs ★★★★★
()
Ответ на: комментарий от legolegs

Вангую гибернацию тогда. При ней ФС как раз остаётся в неконсистентном состоянии.

Второй вариант - reset или отключение по питанию.

Пришлось выдернуть usb-хвост (питание осталось).

И что же тут могло случиться? Наверное ntfs-3g превратил ФС в лапшу? Да не, бред какой-то.

Radjah ★★★★★
()
Ответ на: комментарий от blondy

В первом логе WD

янв 16 14:15:07 workstation kernel: xhci_hcd 0000:00:14.0: ERROR Unknown event condition 10 for slot 12 ep 7 , HC probably busted
янв 16 14:15:39 workstation kernel: sd 9:0:0:0: [sdh] tag#10 uas_eh_abort_handler 0 uas-tag 10 inflight: CMD OUT 
янв 16 14:15:39 workstation kernel: sd 9:0:0:0: [sdh] tag#10 CDB: Write(10) 2a 00 54 12 80 00 00 00 18 00

вот это «HC probably busted» - первая ошибка, она возникла через 15 минут после подключения диска и дальше ошибки так и сыпались. Упоминающийся uas - это https://ru.wikipedia.org/wiki/USB_Attached_SCSI дополнительный протокол для ускорения передачи файлов по USB. Он, строго говоря не необходим, особенно на неизбежно медленном USB2 и часто глючит. Например, моя материнка его поддерживает, но в ядре он для неё принудительно отключён, потому что глюки.

Решение 1: отключить UAS

Вот тут https://ubuntuforums.org/showthread.php?t=2307662 описан похожий случай, решили добавлением бокса в чёрный список.

У тебя янв 16 13:59:52 workstation kernel: usb 2-2: New USB device found, idVendor=4971, idProduct=8017 (и, кстати, судя по остроумному серийному номеру янв 16 13:59:52 workstation kernel: usb 2-2: SerialNumber: 111122223333 бокс китайский в лучших традициях) следовательно, как-то так нужно отключить UAS и по идее глюки уйдут

echo options usb-storage quirks=4971:8017:u | sudo tee /etc/modprobe.d/blacklist_uas_hddbox.conf

Решение 2: отключить энергосбережение на USB-портах

Отредактировать /etc/default/grub

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"

заменить на

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash usbcore.autosuspend=-1"

Перегенерировать настоящий конфиг grub sudo update-grub и перезагрузиться. Чуваку по ссылке не помогло.

Оба решения не должны ничего важного сломать и их легко откатить.

Решение 3: использовать другой USB порт на другом контроллере

Обычно разные контроллеры разным цветом разъёмов обозначены.

Решение 4: использовать другой USB порт на другом контроллере

Использовать бокс другого производителя или не использовать вовсе - подключать прямо к SATA/eSATA.

Наличие проблем проверяется в dmesg -ew.

Если ничего не делать - этот диск с этим компом так и не будет работать нормально, пока разработчикам ядра кто-то не зарепортит проблему и они не починят/обойдут. Чего может не случиться никогда, этож не от IBM железки.

legolegs ★★★★★
()
Последнее исправление: legolegs (всего исправлений: 5)
Ответ на: комментарий от Radjah

Второй вариант - reset или отключение по питанию.

Тред не читай, сразу неси херню. Диск был подключен, работал, потом заглючил и перестал работать и только потом его выключили. Ну конечно, гибернация виновата. И лично Билл Гейтс.

legolegs ★★★★★
()
Ответ на: комментарий от legolegs

Ты через строчку не читай.

Надо анализ лога?

янв 16 13:59:52 workstation kernel: usb 2-2: Manufacturer: JMicron
янв 16 13:59:52 workstation kernel: usb 2-2: SerialNumber: 111122223333

Если лог не правлен, то налицо убердешманский карман.

WD20 PURZ-85GU6Y0

Ммммм... И сэкономили на харде еще тысячу.

xhci_hcd 0000:00:14.0: WARN Set TR Deq Ptr cmd failed due to incorrect slot or ep state.

Как вариант бага в ядре: https://bugzilla.kernel.org/show_bug.cgi?id=202541

Radjah ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.