LINUX.ORG.RU

Насколько всё плохо у меня с SSD?

 , ,


0

2

У меня есть SSD Intel, использую его уже давно, сейчас переставил его в optibay вместо DVD в ноуте. Недавно в логах заметили странные сообщения, хотя диск не используется и даже не размечен пока:

root@hp15:~# dmesg | grep sdb
[    3.494641] sd 1:0:0:0: [sdb] 250069680 512-byte logical blocks: (128 GB/119 GiB)
[    3.494652] sd 1:0:0:0: [sdb] Write Protect is off
[    3.494655] sd 1:0:0:0: [sdb] Mode Sense: 00 3a 00 00
[    3.494674] sd 1:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
[    3.497277] sd 1:0:0:0: [sdb] Attached SCSI disk
[    4.870689] sd 1:0:0:0: [sdb] tag#3 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[    4.870692] sd 1:0:0:0: [sdb] tag#3 Sense Key : Illegal Request [current] 
[    4.870695] sd 1:0:0:0: [sdb] tag#3 Add. Sense: Unaligned write command
[    4.870699] sd 1:0:0:0: [sdb] tag#3 CDB: Read(10) 28 00 00 00 00 48 00 00 30 00
[    4.870701] print_req_error: I/O error, dev sdb, sector 72
[    4.870775] sd 1:0:0:0: [sdb] tag#4 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[    4.870777] sd 1:0:0:0: [sdb] tag#4 Sense Key : Illegal Request [current] 
[    4.870780] sd 1:0:0:0: [sdb] tag#4 Add. Sense: Unaligned write command
[    4.870782] sd 1:0:0:0: [sdb] tag#4 CDB: Read(10) 28 00 00 00 00 88 00 00 78 00
[    4.870784] print_req_error: I/O error, dev sdb, sector 136
[    4.870841] sd 1:0:0:0: [sdb] tag#5 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[    4.870843] sd 1:0:0:0: [sdb] tag#5 Sense Key : Illegal Request [current] 
[    4.870846] sd 1:0:0:0: [sdb] tag#5 Add. Sense: Unaligned write command
[    4.870849] sd 1:0:0:0: [sdb] tag#5 CDB: Read(10) 28 00 00 00 01 08 00 00 f8 00
[    4.870850] print_req_error: I/O error, dev sdb, sector 264
root@hp15:~# fdisk -l /dev/sdb
Disk /dev/sdb: 119,2 GiB, 128035676160 bytes, 250069680 sectors
Disk model: INTEL SSDSC2KW12
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes

Решил посмотреть SMART и вот что мне выдало:

root@hp15:~# smartctl -s on -a /dev/sdb
smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-16-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     INTEL SSDSC2KW128G8
Serial Number:    BTLA82220HLG128BGN
LU WWN Device Id: 5 5cd2e4 14f70b616
Firmware Version: LHF004C
User Capacity:    128 035 676 160 bytes [128 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Form Factor:      2.5 inches
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-3 (minor revision not indicated)
SATA Version is:  SATA 3.2, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Apr 20 22:42:47 2021 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF ENABLE/DISABLE COMMANDS SECTION ===
SMART Enabled.

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(    0) seconds.
Offline data collection
capabilities: 			 (0x53) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					No Offline surface scan supported.
					Self-test supported.
					No Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 (  15) minutes.
SCT capabilities: 	       (0x003d)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       7212
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       1731
170 Unknown_Attribute       0x0033   100   100   010    Pre-fail  Always       -       0
171 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0
172 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0
173 Unknown_Attribute       0x0033   095   095   005    Pre-fail  Always       -       335014658082
174 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       214
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       56
184 End-to-End_Error        0x0033   100   100   090    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0032   020   042   000    Old_age   Always       -       20 (Min/Max 11/42)
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       214
199 UDMA_CRC_Error_Count    0x0032   100   100   000    Old_age   Always       -       1662
225 Unknown_SSD_Attribute   0x0032   100   100   000    Old_age   Always       -       268451
226 Unknown_SSD_Attribute   0x0032   100   100   000    Old_age   Always       -       0
227 Unknown_SSD_Attribute   0x0032   100   100   000    Old_age   Always       -       0
228 Power-off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       0
232 Available_Reservd_Space 0x0033   100   100   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   093   093   000    Old_age   Always       -       0
236 Unknown_Attribute       0x0032   093   093   000    Old_age   Always       -       0
241 Total_LBAs_Written      0x0032   100   100   000    Old_age   Always       -       268451
242 Total_LBAs_Read         0x0032   100   100   000    Old_age   Always       -       222603
249 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       11378
252 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       78

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      7167         -
# 2  Short offline       Completed without error       00%       771         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.


Ну что уже появились ошибки, я вижу. Но насколько всё плохо?

Ответ на: комментарий от Vsevolod-linuxoid

Если этот показатель растёт, то ошибка как раз при передаче данных наружу. Может питание ещё отходит.

Меня смущает отсутствие reset после ошибки, так что могу ошибаться.

Radjah ★★★★★ ()
Ответ на: комментарий от anonymous

Чо там палить-то? :) Раньше да, склад с хардами сожгли бы, чтоб цены не снижать, или завод во Вьетнаме утопили, чтоб цены приподнять :) А щас удобно — и продали и дефицит создали :)

slackwarrior ★★★★★ ()
Ответ на: комментарий от Vsevolod-linuxoid

Может просто «отошел покурить» разъем :) Бывает много веселья от дешманских SATA кабелей/разъемов/переходников, которые при хроническом подогреве и даже без него «высыхают», подвергаются усушке-утруске... И унутренними напряжениями из-за укорачивания-деформирования при нагреве вылазят-перекашиваются в слоте, особенно если без клипс. Ну и переходиник можно для начала целиком заменить или погонять хард в заведомо нормальном стенде без сомнительных посредников :)

slackwarrior ★★★★★ ()
Ответ на: комментарий от anonymous

Эх, дикари! Перенимаете только что на поверхности :) Лучше б создавали предпосылки для «золотых лихорадок» и лопаты продавали, вместо беготни за стадом оленей. Без «легального лоббирования» половина бизнес-практик «как у них» вообще не работает, либо это вот «боюсь товарищ майор» :)

slackwarrior ★★★★★ ()