LINUX.ORG.RU

Увеличивается количество ошибок /dev/nvme0 при каждой загрузке

 , , ,


1

3

Привет!

Есть такая проблема.

На SSD, который вставлен в M2, стоит Linux Mint 21. Утилиты smartctl и nvme выдают ошибки. Причем количество этих ошибок увеличивается с каждой загрузкой системы. Предыдущая система стояла где-то полгода после чего начали появляться ошибки в момент выключения компьютера и компьютер перестал сам отключаться. До этого момента я не запускал утилиты и не смотрел логи, так что скорее всего счетчик ошибок увеличивался и тогда

Ошибки вида:

.................
error_count	: 1
sqid		: 0
cmdid		: 0x1e
status_field	: 0x101(QID_INVALID: The creation of the I/O Completion Queue failed due to an invalid queue identifier specified as part of the command. An invalid queue identifier is one that is currently in use or one that is outside the range supported by the controller)
phase_tag	: 0
parm_err_loc	: 0
lba		: 0
nsid		: 0
vs		: 0
trtype		: The transport type is not indicated or the error is not transport related.
cs		: 0
trtype_spec_info: 0

Мой диск: sudo nvme list

Node           SN            Model                Namespace Usage                      Format           FW Rev  
-------------- ------------- -------------------- --------- -------------------------- ---------------- --------
/dev/nvme0n1   30044294321   SPCC M.2 PCIe SSD    1           2,05  TB /   2,05  TB    512   B +  0 B   B00u7M10

smartctl: sudo smartctl -a -t long /dev/nvme0

smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.15.0-52-generic] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       SPCC M.2 PCIe SSD
Serial Number:                      30044294321
Firmware Version:                   B00u7M10
PCI Vendor/Subsystem ID:            0x1e4b
IEEE OUI Identifier:                0x000000
Total NVM Capacity:                 2 048 408 248 320 [2,04 TB]
Unallocated NVM Capacity:           0
Controller ID:                      0
NVMe Version:                       1.3
Number of Namespaces:               1
Namespace 1 Size/Capacity:          2 048 408 248 320 [2,04 TB]
Namespace 1 Formatted LBA Size:     512
Namespace 1 IEEE EUI-64:            202020 2020202020
Local Time is:                      Wed Oct 26 21:57:09 2022 +07
Firmware Updates (0x12):            1 Slot, no Reset required
Optional Admin Commands (0x0006):   Format Frmw_DL
Optional NVM Commands (0x000f):     Comp Wr_Unc DS_Mngmt Wr_Zero
Log Page Attributes (0x03):         S/H_per_NS Cmd_Eff_Lg
Maximum Data Transfer Size:         256 Pages
Warning  Comp. Temp. Threshold:     120 Celsius
Critical Comp. Temp. Threshold:     130 Celsius

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     6.50W       -        -    0  0  0  0        0       0
 1 +     5.80W       -        -    1  1  1  1        0       0
 2 +     3.60W       -        -    2  2  2  2        0       0
 3 -   0.0800W       -        -    3  3  3  3     5000   10000
 4 -   0.0055W       -        -    4  4  4  4     5000   45000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        41 Celsius
Available Spare:                    100%
Available Spare Threshold:          1%
Percentage Used:                    0%
Data Units Read:                    24 148 770 [12,3 TB]
Data Units Written:                 26 423 442 [13,5 TB]
Host Read Commands:                 565 420 062
Host Write Commands:                48 759 754
Controller Busy Time:               903
Power Cycles:                       204
Power On Hours:                     499
Unsafe Shutdowns:                   48
Media and Data Integrity Errors:    2
Error Information Log Entries:      52
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               41 Celsius
Temperature Sensor 2:               41 Celsius
Temperature Sensor 3:               41 Celsius
Temperature Sensor 4:               41 Celsius
Temperature Sensor 5:               41 Celsius
Temperature Sensor 6:               41 Celsius
Temperature Sensor 7:               41 Celsius
Temperature Sensor 8:               41 Celsius

Error Information (NVMe Log 0x01, 16 of 64 entries)
Num   ErrCount  SQId   CmdId  Status  PELoc          LBA  NSID    VS
  0          1     0  0x1004  0x0004  0x000            0     0     -
  1          2     0  0x0027  0x0202  0x000            0     0     -
  2          3     0  0x0028  0x0202  0x000            0     0     -
  3          4     0  0x601a  0x0004  0x000            0     0     -
  4          5     0  0x001e  0x0202  0x000            0     0     -
  5          6     0  0x0027  0x0202  0x000            0     0     -
  6          7     0  0x0028  0x0202  0x000            0     0     -
  7          8     0  0x600a  0x0004  0x000            0     0     -
  8          9     0  0x1002  0x0004  0x000            0     0     -
  9         10     0  0x1000  0x0004  0x000            0     0     -
 10         11     0  0x001e  0x0202  0x000            0     0     -
 11         12     0  0x0027  0x0202  0x000            0     0     -
 12         13     0  0x0028  0x0202  0x000            0     0     -
 13       3406     2  0x03a2  0x0281  0x000   2687963448     0     -
 14       3407     2  0x03a2  0x0281  0x000   2687963448     0     -
 15       3408     2  0x03a2  0x0281  0x000   2687963448     0     -
... (48 entries not read)

sudo nvme error-log /dev/nvme0 :

Error Log Entries for device:nvme0 entries:64
.................
 Entry[ 0]   
.................
error_count	: 1
sqid		: 0
cmdid		: 0x1004
status_field	: 0x2(INVALID_FIELD: A reserved coded value or an unsupported value in a defined field)
phase_tag	: 0
parm_err_loc	: 0
lba		: 0
nsid		: 0
vs		: 0
trtype		: The transport type is not indicated or the error is not transport related.
cs		: 0
trtype_spec_info: 0
.................
 Entry[ 1]   
.................
error_count	: 2
sqid		: 0
cmdid		: 0x27
status_field	: 0x101(QID_INVALID: The creation of the I/O Completion Queue failed due to an invalid queue identifier specified as part of the command. An invalid queue identifier is one that is currently in use or one that is outside the range supported by the controller)
phase_tag	: 0
parm_err_loc	: 0
lba		: 0
nsid		: 0
vs		: 0
trtype		: The transport type is not indicated or the error is not transport related.
cs		: 0
trtype_spec_info: 0
.................
 Entry[ 2]   
.................
error_count	: 3
sqid		: 0
cmdid		: 0x28
status_field	: 0x101(QID_INVALID: The creation of the I/O Completion Queue failed due to an invalid queue identifier specified as part of the command. An invalid queue identifier is one that is currently in use or one that is outside the range supported by the controller)
phase_tag	: 0
parm_err_loc	: 0
lba		: 0
nsid		: 0
vs		: 0
trtype		: The transport type is not indicated or the error is not transport related.
cs		: 0
trtype_spec_info: 0
.................
 Entry[ 3]   
.................
error_count	: 4
sqid		: 0
cmdid		: 0x601a
status_field	: 0x2(INVALID_FIELD: A reserved coded value or an unsupported value in a defined field)
phase_tag	: 0
parm_err_loc	: 0
lba		: 0
nsid		: 0
vs		: 0
trtype		: The transport type is not indicated or the error is not transport related.
cs		: 0
trtype_spec_info: 0
.................
 Entry[ 4]   
...

cat /var/log/syslog | grep -i smart | grep -i nvm :

Oct 22 19:53:15 silart-desk smartd[3829]: Device: /dev/nvme0, opened
Oct 22 19:53:15 silart-desk smartd[3829]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 22 19:53:15 silart-desk smartd[3829]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 22 19:53:15 silart-desk smartd[3829]: Monitoring 0 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 22 19:53:15 silart-desk smartd[3829]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 22 21:53:15 silart-desk smartd[3829]: Device: /dev/nvme0, number of Error Log entries increased from 5 to 6
Oct 23 14:21:09 silart-desk smartd[930]: Device: /dev/nvme0, opened
Oct 23 14:21:09 silart-desk smartd[930]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 23 14:21:09 silart-desk smartd[930]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 23 14:21:09 silart-desk smartd[930]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 23 14:21:09 silart-desk smartd[930]: Monitoring 0 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 23 14:21:09 silart-desk smartd[930]: Device: /dev/nvme0, number of Error Log entries increased from 6 to 7
Oct 23 14:21:09 silart-desk smartd[930]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 23 14:36:00 silart-desk smartd[958]: Device: /dev/nvme0, opened
Oct 23 14:36:00 silart-desk smartd[958]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 23 14:36:00 silart-desk smartd[958]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 23 14:36:00 silart-desk smartd[958]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 23 14:36:00 silart-desk smartd[958]: Monitoring 0 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 23 14:36:00 silart-desk smartd[958]: Device: /dev/nvme0, number of Error Log entries increased from 7 to 8
Oct 23 14:36:00 silart-desk smartd[958]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 23 14:38:02 silart-desk smartd[964]: Device: /dev/nvme0, opened
Oct 23 14:38:02 silart-desk smartd[964]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 23 14:38:02 silart-desk smartd[964]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 23 14:38:02 silart-desk smartd[964]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 23 14:38:02 silart-desk smartd[964]: Monitoring 0 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 23 14:38:02 silart-desk smartd[964]: Device: /dev/nvme0, number of Error Log entries increased from 8 to 9
Oct 23 14:38:02 silart-desk smartd[964]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 23 15:09:11 silart-desk smartd[962]: Device: /dev/nvme0, opened
Oct 23 15:09:11 silart-desk smartd[962]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 23 15:09:11 silart-desk smartd[962]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 23 15:09:11 silart-desk smartd[962]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 23 15:09:11 silart-desk smartd[962]: Monitoring 0 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 23 15:09:11 silart-desk smartd[962]: Device: /dev/nvme0, number of Error Log entries increased from 9 to 10
Oct 23 15:09:11 silart-desk smartd[962]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 23 15:20:51 silart-desk smartd[923]: Device: /dev/nvme0, opened
Oct 23 15:20:51 silart-desk smartd[923]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 23 15:20:51 silart-desk smartd[923]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 23 15:20:51 silart-desk smartd[923]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 23 15:20:51 silart-desk smartd[923]: Monitoring 0 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 23 15:20:51 silart-desk smartd[923]: Device: /dev/nvme0, number of Error Log entries increased from 10 to 11
Oct 23 15:20:51 silart-desk smartd[923]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 23 19:31:29 silart-desk smartd[925]: Device: /dev/nvme0, opened
Oct 23 19:31:29 silart-desk smartd[925]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 23 19:31:29 silart-desk smartd[925]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 23 19:31:29 silart-desk smartd[925]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 23 19:31:29 silart-desk smartd[925]: Monitoring 0 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 23 19:31:29 silart-desk smartd[925]: Device: /dev/nvme0, number of Error Log entries increased from 11 to 12
Oct 23 19:31:29 silart-desk smartd[925]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 23 19:54:10 silart-desk smartd[1101]: Device: /dev/nvme0, opened
Oct 23 19:54:10 silart-desk smartd[1101]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 23 19:54:10 silart-desk smartd[1101]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 23 19:54:10 silart-desk smartd[1101]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 23 19:54:10 silart-desk smartd[1101]: Monitoring 3 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 23 19:54:10 silart-desk smartd[1101]: Device: /dev/nvme0, number of Error Log entries increased from 12 to 13
Oct 23 19:54:10 silart-desk smartd[1101]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 23 21:05:39 silart-desk smartd[1094]: Device: /dev/nvme0, opened
Oct 23 21:05:39 silart-desk smartd[1094]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 23 21:05:39 silart-desk smartd[1094]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 23 21:05:39 silart-desk smartd[1094]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 23 21:05:39 silart-desk smartd[1094]: Monitoring 3 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 23 21:05:39 silart-desk smartd[1094]: Device: /dev/nvme0, number of Error Log entries increased from 13 to 14
Oct 23 21:05:39 silart-desk smartd[1094]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 23 23:26:00 silart-desk smartd[1147]: Device: /dev/nvme0, opened
Oct 23 23:26:00 silart-desk smartd[1147]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 23 23:26:00 silart-desk smartd[1147]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 23 23:26:00 silart-desk smartd[1147]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 23 23:26:00 silart-desk smartd[1147]: Monitoring 3 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 23 23:26:00 silart-desk smartd[1147]: Device: /dev/nvme0, number of Error Log entries increased from 14 to 15
Oct 23 23:26:00 silart-desk smartd[1147]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 24 21:25:02 silart-desk smartd[1100]: Device: /dev/nvme0, opened
Oct 24 21:25:02 silart-desk smartd[1100]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 24 21:25:02 silart-desk smartd[1100]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 24 21:25:02 silart-desk smartd[1100]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 24 21:25:02 silart-desk smartd[1100]: Monitoring 3 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 24 21:25:02 silart-desk smartd[1100]: Device: /dev/nvme0, number of Error Log entries increased from 15 to 16
Oct 24 21:25:02 silart-desk smartd[1100]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 24 23:33:03 silart-desk smartd[1043]: Device: /dev/nvme0, opened
Oct 24 23:33:03 silart-desk smartd[1043]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 24 23:33:03 silart-desk smartd[1043]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 24 23:33:03 silart-desk smartd[1043]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 24 23:33:03 silart-desk smartd[1043]: Monitoring 1 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 24 23:33:03 silart-desk smartd[1043]: Device: /dev/nvme0, number of Error Log entries increased from 16 to 17
Oct 24 23:33:03 silart-desk smartd[1043]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 24 23:38:02 silart-desk smartd[1042]: Device: /dev/nvme0, opened
Oct 24 23:38:02 silart-desk smartd[1042]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 24 23:38:02 silart-desk smartd[1042]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 24 23:38:02 silart-desk smartd[1042]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 24 23:38:02 silart-desk smartd[1042]: Monitoring 1 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 24 23:38:02 silart-desk smartd[1042]: Device: /dev/nvme0, number of Error Log entries increased from 17 to 18
Oct 24 23:38:02 silart-desk smartd[1042]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 24 23:52:49 silart-desk smartd[1044]: Device: /dev/nvme0, opened
Oct 24 23:52:49 silart-desk smartd[1044]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 24 23:52:49 silart-desk smartd[1044]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 24 23:52:49 silart-desk smartd[1044]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 24 23:52:49 silart-desk smartd[1044]: Monitoring 1 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 24 23:52:49 silart-desk smartd[1044]: Device: /dev/nvme0, number of Error Log entries increased from 18 to 19
Oct 24 23:52:49 silart-desk smartd[1044]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 25 00:07:43 silart-desk smartd[1028]: Device: /dev/nvme0, opened
Oct 25 00:07:43 silart-desk smartd[1028]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 25 00:07:43 silart-desk smartd[1028]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 25 00:07:43 silart-desk smartd[1028]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 25 00:07:43 silart-desk smartd[1028]: Monitoring 1 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 25 00:07:43 silart-desk smartd[1028]: Device: /dev/nvme0, number of Error Log entries increased from 19 to 20
Oct 25 00:07:43 silart-desk smartd[1028]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 25 18:58:39 silart-desk smartd[1044]: Device: /dev/nvme0, opened
Oct 25 18:58:39 silart-desk smartd[1044]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 25 18:58:39 silart-desk smartd[1044]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 25 18:58:39 silart-desk smartd[1044]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 25 18:58:39 silart-desk smartd[1044]: Monitoring 1 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 25 18:58:39 silart-desk smartd[1044]: Device: /dev/nvme0, number of Error Log entries increased from 20 to 21
Oct 25 18:58:39 silart-desk smartd[1044]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 25 23:41:36 silart-desk smartd[1014]: Device: /dev/nvme0, opened
Oct 25 23:41:36 silart-desk smartd[1014]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 25 23:41:36 silart-desk smartd[1014]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 25 23:41:36 silart-desk smartd[1014]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 25 23:41:36 silart-desk smartd[1014]: Monitoring 1 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 25 23:41:36 silart-desk smartd[1014]: Device: /dev/nvme0, number of Error Log entries increased from 21 to 34
Oct 25 23:41:36 silart-desk smartd[1014]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 26 00:16:30 silart-desk smartd[1034]: Device: /dev/nvme0, opened
Oct 26 00:16:30 silart-desk smartd[1034]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 26 00:16:30 silart-desk smartd[1034]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 26 00:16:30 silart-desk smartd[1034]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 26 00:16:30 silart-desk smartd[1034]: Monitoring 1 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 26 00:16:30 silart-desk smartd[1034]: Device: /dev/nvme0, number of Error Log entries increased from 34 to 41
Oct 26 00:16:30 silart-desk smartd[1034]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 25 21:59:10 silart-desk smartd[1043]: Device: /dev/nvme0, opened
Oct 25 21:59:10 silart-desk smartd[1043]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 25 21:59:10 silart-desk smartd[1043]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 25 21:59:10 silart-desk smartd[1043]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 25 21:59:10 silart-desk smartd[1043]: Monitoring 1 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 25 21:59:10 silart-desk smartd[1043]: Device: /dev/nvme0, number of Error Log entries increased from 41 to 45
Oct 25 21:59:10 silart-desk smartd[1043]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 25 22:33:55 silart-desk smartd[1039]: Device: /dev/nvme0, opened
Oct 25 22:33:55 silart-desk smartd[1039]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 25 22:33:55 silart-desk smartd[1039]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 25 22:33:55 silart-desk smartd[1039]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 25 22:33:55 silart-desk smartd[1039]: Monitoring 1 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 25 22:33:55 silart-desk smartd[1039]: Device: /dev/nvme0, number of Error Log entries increased from 45 to 49
Oct 25 22:33:55 silart-desk smartd[1039]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 25 22:44:34 silart-desk smartd[1019]: Device: /dev/nvme0, opened
Oct 25 22:44:34 silart-desk smartd[1019]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 25 22:44:34 silart-desk smartd[1019]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 25 22:44:34 silart-desk smartd[1019]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 25 22:44:34 silart-desk smartd[1019]: Monitoring 1 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 25 22:44:34 silart-desk smartd[1019]: Device: /dev/nvme0, number of Error Log entries increased from 49 to 51
Oct 25 22:44:34 silart-desk smartd[1019]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 26 21:22:46 silart-desk smartd[1017]: Device: /dev/nvme0, opened
Oct 26 21:22:46 silart-desk smartd[1017]: Device: /dev/nvme0, SPCC M.2 PCIe SSD, S/N:30044294321, FW:B00u7M10, 2.04 TB
Oct 26 21:22:46 silart-desk smartd[1017]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 26 21:22:46 silart-desk smartd[1017]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state
Oct 26 21:22:46 silart-desk smartd[1017]: Monitoring 1 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 26 21:22:46 silart-desk smartd[1017]: Device: /dev/nvme0, number of Error Log entries increased from 51 to 52
Oct 26 21:22:46 silart-desk smartd[1017]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.SPCC_M_2_PCIe_SSD-30044294321.nvme.state

Можно видеть такую запись:

smartd[1017]: Device: /dev/nvme0, number of Error Log entries increased from 51 to 52

Количество постоянно увеличивается.

Вопрос: С чем это может быть связано?

Получается что со временем система деградирует.

Сдавал SSD в ДНС где местные специалисты тестировали диск и ничего не нашли. Думал что там работают халтурщики. Написал скрипт на Python'е, который сначала пишет блоки данных прямо в блочное устройство /dev/nvme0, заполняя весь диск, а потом читает записанные блоки, считает md5 и сравнивает с первоначальным. Оказалось что все данные были прочитаны верно.

Пробовал перепрошить диск. Установил винду, оказалось что прошивка самая свежая. Обновил прошивку материнской платы - тоже не помогло.

Have any ideas?


Error Information Log Entries: 52

Рост этого показателя сам по себе не означает каких-то проблем с накопителем. Хост может послать некорректную команду, накопитель сообщает хосту, что команда некорректная, увеличивает этот счётчик. У меня nvme плагин для collectd накрутил полтора миллиона таких ошибок, пока я не собрался его запатчить. У тебя, вероятно, что-то при загрузке посылает ошибочную команду на накопитель. Попробуй загружаться сначала без всего, потом запуская софт наблюдай за числом ошибок. Возможно, получится отловить виновника.

Media and Data Integrity Errors: 2

А вот об этих ошибках как раз стоит побеспокоиться. Два раза у тебя накопитель не смог с первого раза прочитать данные. Возможно, он уже переназначил сбойные блоки, возможно нет. Если при холостом чтении этот показатель продолжает увеличиваться, попробуй очистить накопитель полностью и прогнать TRIM по всему объёму.

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat

попробуй очистить накопитель полностью и прогнать TRIM по всему объёму

Подскажите пожалуйста, как это сделать? Может есть ссылка на статью? У меня нет опыта работы с SSD

silart
() автор топика
Ответ на: комментарий от silart

как это сделать

Опасный способ — утилита blkdiscard. Если её запустить, указав блочное устройство, она пошлёт TRIM на весь объём. Ошибка в указании блочного устройства грозит потерей данных на не том накопителе. В некотором смысле это опаснее, чем ошибиться устройством назначения в dd. Там хотя бы можно успеть прервать запись. С blkdiscard команда уходит в накопитель, и уже накопитель тихонечко в фоне очищает флеш. Прервать не получится.

Безопасный способ — fstrim. Работает только с файловыми системами, и просит сделать TRIM у драйвера файловой системы. Очищает только свободное место. То есть если дефект оказался там, где у файловой системы метаданные, например, таблицы инодов ext4, очистка не починит сбойные блоки. Но зато если ошибся, данные не будут утеряны.

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat

Данные я не боюсь потерять. Можно еще раз потом систему переустановить. То есть если запустить

blkdiscard -f /dev/nvme0

накопитель переназначит сбойные блоки и выведет их из обращения? Я так понимаю это происходит на уровне железа, а не файловой системы? И он выбросит все сбойные блоки и не будет давать в них записывать данные? А обязательно ли заполнять нулями? Там есть опция -z.

silart
() автор топика
Последнее исправление: silart (всего исправлений: 2)
Ответ на: комментарий от silart

То есть если запустить <…> накопитель переназначит сбойные блоки и выведет их из обращения?

Можно надеяться, но гарантий нет. Просто пользователю накопителя доступны три способа повлиять на ситуацию:

  1. прочитать несколько раз сбойный участок и надеяться, что накопитель сообразит в фоне переназначит блок;
  2. записать что-нибудь поверх сбойного участка и надеяться, что накопитель либо переназначит блоки и потом сотрёт блок, либо сотрёт блок и сразу запишет данные;
  3. попросить накопитель пометить блок свободным (TRIM) и надеяться, что он сообразит стереть освободившиеся блоки.

Прямого доступа к флешу накопителей у пользователей нет. Всё зависит от контроллера и его прошивки.

А обязательно ли заполнять нулями? Там есть опция -z.

Насколько мне известно, эта опция подразумевает запись нулей. По факту это может оказаться либо эквивалент dd if=/dev/zero of=block-device-name, либо эквивалент TRIM. Никогда не экспериментировал с этой опцией. Мне всегда было достаточно просто пометить блоки свободными, и не особо важно, что там читается после TRIM, нули, единицы или даже просто мусор.

i-rinat ★★★★★
()
Ответ на: комментарий от silart

blkdiscard -f /dev/nvme0

Для общего развития, разве эта команда сработает? Диск же nvme0n1, т.е. 1 диск на 0 контроллере. А так получается, сделай трим на 0 контроллере? Что будет если два диска?

ComIngSoon
()