LINUX.ORG.RU

Device: /dev/nvme0, number of Error Log entries increased from 3794 to 3795

 ,


0

1
Model Number:                       Samsung SSD 970 EVO Plus 500GB
Firmware Version:                   2B2QEXM7
  1. я так понимаю, что это ошибка прошивки?
  2. из-под онтопика можно как-то прошивку обновить?
  3. прошивка обновляется без форматирования?
★★★★

Последнее исправление: bryak (всего исправлений: 2)

У моих двух Кингстонов при каждом включении счетчик ошибок увеличивается на 2, видимо, UEFI при загрузке шлёт команды, которые они не понимают. Если в остальном проблем нет, можешь просто забить. Фирмварь, если есть новая, можно попробовать прошить (для данных это должно быть безопасно, форматировать не надо), но не факт, что поможет.

anonymous
()

Смотришь nvme error-log /dev/nvme0, видишь, что там на самом деле не ошибки, забываешь об этом.

из-под онтопика можно как-то прошивку обновить?

Да, можно выдернуть утилиту из ISO с сайта Samsung (они на Linux). Но проще с ISO и обновлять.

прошивка обновляется без форматирования?

Да, но резервные копии делать надо.

anonymous
()
Ответ на: комментарий от anonymous
Error Log Entries for device:nvme0 entries:64
.................
 Entry[ 0]
.................
error_count     : 3796
sqid            : 0
cmdid           : 0xd01b
status_field    : 0x2002(Invalid Field in Command: A reserved coded value or an unsupported value in a defined field)
phase_tag       : 0
parm_err_loc    : 0xffff
lba             : 0
nsid            : 0
vs              : 0
trtype          : The transport type is not indicated or the error is not transport related.
cs              : 0
trtype_spec_info: 0
.................
 Entry[ 1]
.................
error_count     : 0
sqid            : 0
cmdid           : 0
status_field    : 0(Successful Completion: The command completed without error)
phase_tag       : 0
parm_err_loc    : 0
lba             : 0
nsid            : 0
vs              : 0
trtype          : The transport type is not indicated or the error is not transport related.
cs              : 0
trtype_spec_info: 0
.................
 Entry[ 2]
.................
error_count     : 0
sqid            : 0
cmdid           : 0
status_field    : 0(Successful Completion: The command completed without error)
phase_tag       : 0
parm_err_loc    : 0
lba             : 0
nsid            : 0
vs              : 0
trtype          : The transport type is not indicated or the error is not transport related.
cs              : 0
trtype_spec_info: 0
.................
 Entry[ 3]
.................
error_count     : 0
sqid            : 0
cmdid           : 0
status_field    : 0(Successful Completion: The command completed without error)
phase_tag       : 0
parm_err_loc    : 0
lba             : 0
nsid            : 0
vs              : 0
trtype          : The transport type is not indicated or the error is not transport related.
cs              : 0
trtype_spec_info: 0
.................
bryak ★★★★
() автор топика

из-под онтопика можно как-то прошивку обновить?

Можно. Раскурочить iso и выдрать оттуда fumagician и саму прошивку

прошивка обновляется без форматирования?

Да, но как обычно, желателен полный бэкап.

Dimez ★★★★★
()
Ответ на: комментарий от bryak

У тебя хост послал в NVMe устройство команду, которую тот не распознал. Это считается ошибкой.

У collectd вроде до сих пор есть баг, который накручивает число ошибок, посылая неправильно сформированные команды. Возможно у тебя аналогично какой-то софт пытается проверять NVMe накопитель, но либо посылает команды с ошибками в параметрах, либо вообще незнакомые NVMe накопителю команды.

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat
=== START OF INFORMATION SECTION ===
Model Number:                       Samsung SSD 970 EVO Plus 500GB
Serial Number:                      xxxxxxxxx
Firmware Version:                   2B2QEXM7
PCI Vendor/Subsystem ID:            0x144d
IEEE OUI Identifier:                0x002538
Total NVM Capacity:                 500,107,862,016 [500 GB]
Unallocated NVM Capacity:           0
Controller ID:                      4
NVMe Version:                       1.3
Number of Namespaces:               1
Namespace 1 Size/Capacity:          500,107,862,016 [500 GB]
Namespace 1 Utilization:            69,756,473,344 [69.7 GB]
Namespace 1 Formatted LBA Size:     512
Namespace 1 IEEE EUI-64:            002538 5131b148ab
Local Time is:                      Sun Sep  7 00:31:50 2025 MSK
Firmware Updates (0x16):            3 Slots, no Reset required
Optional Admin Commands (0x0017):   Security Format Frmw_DL Self_Test
Optional NVM Commands (0x005f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
Log Page Attributes (0x03):         S/H_per_NS Cmd_Eff_Lg
Maximum Data Transfer Size:         512 Pages
Warning  Comp. Temp. Threshold:     85 Celsius
Critical Comp. Temp. Threshold:     85 Celsius

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     7.80W       -        -    0  0  0  0        0       0
 1 +     6.00W       -        -    1  1  1  1        0       0
 2 +     3.40W       -        -    2  2  2  2        0       0
 3 -   0.0700W       -        -    3  3  3  3      210    1200
 4 -   0.0100W       -        -    4  4  4  4     2000    8000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        33 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    0%
Data Units Read:                    7,272,175 [3.72 TB]
Data Units Written:                 1,644,875 [842 GB]
Host Read Commands:                 72,863,719
Host Write Commands:                27,556,242
Controller Busy Time:               158
Power Cycles:                       1,577
Power On Hours:                     215
Unsafe Shutdowns:                   61
Media and Data Integrity Errors:    0
Error Information Log Entries:      3,799
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               33 Celsius
Temperature Sensor 2:               30 Celsius

Error Information (NVMe Log 0x01, 16 of 64 entries)
Num   ErrCount  SQId   CmdId  Status  PELoc          LBA  NSID    VS
  0       3799     0  0x000c  0x4004      -            0     0     -
bryak ★★★★
() автор топика
Ответ на: комментарий от bryak

Проблем с флешем нет, резерв ещё даже не начинал использоваться. Он даже никогда не перегревался. Видимых проблем нет.

Это скорее всего реально какой-то софт для мониторинга пытается проверять состояние накопителя, но посылает не те команды. Не выглядит чем-то страшным.

i-rinat ★★★★★
()
Ответ на: комментарий от bryak

А где видно перегрев

Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0

Это количество секунд, которое накопитель провёл в перегретом состоянии, за всё время жизни.

и использовался резерв или нет?

«Available Spare» — сколько резерва флеша осталось. «Available Spare Threshold» — минимальный допустимый объём резерва по мнению производителя. «Percentage Used» — сколько по мнению производителя выработано ресурса SSD.

i-rinat ★★★★★
()