LINUX.ORG.RU
ФорумAdmin

Линейная скорость записи на nvme = 500 Кб/сек. Лечится перезагрузкой.

 , , , ,


0

1

Есть ноутбук Dell e7470 с диском Samsung 970 Evo 500 Гб. Ядро 4.19.0-16-amd64.

Периодически, у ноутбука начинает тормозить дисковая подсистема (скорость записи падает до 500 Кб/сек). После перезагрузки - возрастает до нормальной).

Я подозреваю, что тормоза не связаны с объектами на диске (FS, LUKS, LVM). Просто или всё тормозит, или ничего не тормозит.

Смарт у диска в норме. Прошивка - последняя.

Перезагружаю ноутбук я редко (обычно - когда апдейт к ядру выходит), зато отправляю в спящий режим по многу раз в день. Может, с этим проблема связана?

Есть идеи?

Вот SMART:

smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-16-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       Samsung SSD 970 EVO 500GB
Serial Number:                      S466NX0M131361J
Firmware Version:                   2B2QEXE7
PCI Vendor/Subsystem ID:            0x144d
IEEE OUI Identifier:                0x002538
Total NVM Capacity:                 500,107,862,016 [500 GB]
Unallocated NVM Capacity:           0
Controller ID:                      4
Number of Namespaces:               1
Namespace 1 Size/Capacity:          500,107,862,016 [500 GB]
Namespace 1 Utilization:            448,646,172,672 [448 GB]
Namespace 1 Formatted LBA Size:     512
Namespace 1 IEEE EUI-64:            002538 5191b07f1d
Local Time is:                      Thu Apr  8 14:33:54 2021 MSK
Firmware Updates (0x16):            3 Slots, no Reset required
Optional Admin Commands (0x0017):   Security Format Frmw_DL Self_Test
Optional NVM Commands (0x005f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
Maximum Data Transfer Size:         512 Pages
Warning  Comp. Temp. Threshold:     85 Celsius
Critical Comp. Temp. Threshold:     85 Celsius

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     6.20W       -        -    0  0  0  0        0       0
 1 +     4.30W       -        -    1  1  1  1        0       0
 2 +     2.10W       -        -    2  2  2  2        0       0
 3 -   0.0400W       -        -    3  3  3  3      210    1200
 4 -   0.0050W       -        -    4  4  4  4     2000    8000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02, NSID 0x1)
Critical Warning:                   0x00
Temperature:                        36 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    2%
Data Units Read:                    6,448,585 [3.30 TB]
Data Units Written:                 35,865,011 [18.3 TB]
Host Read Commands:                 140,475,553
Host Write Commands:                581,435,330
Controller Busy Time:               1,677
Power Cycles:                       3,354
Power On Hours:                     2,530
Unsafe Shutdowns:                   109
Media and Data Integrity Errors:    0
Error Information Log Entries:      3,647
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               36 Celsius
Temperature Sensor 2:               37 Celsius

Error Information (NVMe Log 0x01, max 64 entries)
No Errors Logged
★★★★★

У меня вчера smb шара отвалилась (сдох диск, завис контроллер, кернел паник), в этот момент на эту шару FF качал файл.

(скорость записи падает до 500 Кб/сек)

Вот такой-же симптом при этом был. Сначала 500, потом начала снижаться. При этом можно было открыть папку, куда шара примонтирована, и даже свойства файлов посмотреть. И загрузка как-бы продолжалась, хотя писать по факту было не куда.

anonymous ()

С новым тебя ноутбуком, %username%!!!

Шо-шо, походу что-то отвалилося внутри твоего нотбука и перегревается.

anonymous ()
Ответ на: комментарий от darkenshvein

dmesg

Просматривал, ничего в глаза не бросилось. Начнёт тормозить - посмотрю внимательней/выложу сюда.

Harliff ★★★★★ ()

У тебя внушительная горка ошибок, не связанных с состоянием самих ячеек памяти:

Error Information Log Entries: 3,647

Что говорит nvme error-log?

aidaho ★★★★★ ()
Ответ на: комментарий от anonymous

походу что-то отвалилося внутри твоего нотбука и перегревается.

Вполне может быть, кстати. У меня бывает, что ноутбук засыпает, а потом снова включается. Я этого не замечаю и засовываю его в рюкзак, где он сильно нагревается. Может быть, диск входит в режим жесткого тротлинга, а потом из него не выходит…

Спасибо за идею.

Harliff ★★★★★ ()
Ответ на: комментарий от aidaho

Что говорит nvme error-log?

Что error_count = 0.

Error Log Entries for device:nvme0n1 entries:64
.................
 Entry[ 0]   
.................
error_count  : 0
sqid         : 0
cmdid        : 0
status_field : 0(SUCCESS: The command completed successfully)
parm_err_loc : 0
lba          : 0
nsid         : 0
vs           : 0
cs           : 0
.................

и таких - 64 записи.

Harliff ★★★★★ ()
Последнее исправление: Harliff (всего исправлений: 1)
Ответ на: комментарий от Harliff

таких - 64 записи

Там больше и не хранится. Но что-то в этих трёх тысячах происходило.
Для сравнения, я за несколько лет насобирал самсунгом всего 68.

Может быть что угодно, начиная от отвала контактов в разъёме, до проблем с материнкой.

aidaho ★★★★★ ()
Ответ на: комментарий от aidaho

Значение «Error Information Log Entries» понемногу увеличивается.

Планирую переставить диск в другой ноутбук и посмотреть, как он там будет работать.

Harliff ★★★★★ ()
Ответ на: комментарий от Harliff

У меня collectd надёргал около 412 тысяч ошибок за три месяца. В логе отображаются как 0x4016(INVALID_NS: The namespace or the format of that namespace is invalid).

i-rinat ★★★★★ ()
Ответ на: комментарий от Archer73

Когда тормозит температура диска нормальная?

Да.

Harliff ★★★★★ ()
Ответ на: комментарий от Harliff

И проблем нет?

Проблемы были раньше — что-то вроде сбойных секторов. Изначальные пара тысяч записей в лог были как раз из-за экспериментов по чтению этих сбойных секторов. Потом было более или менее стабильно, до декабря 2020, когда обновился collectd и начал собирать smart и с nvme накопителей. На графиках видно, как «Error Information Log Entries» линейно растёт просто от времени работы.

Каких-то проблем со скоростями записи нет.

Но тут нужно заметить, что пишу на диск я заметно меньше, чем ты. У тебя же записи в пять раз больше, чем чтения. Это странно.

Какая модель диска?

Samsung SSD 970 EVO 2TB
Подробности вот тут: [жж] словил сбойные сектора на nvme ssd

i-rinat ★★★★★ ()
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.