LINUX.ORG.RU
ФорумAdmin

Посыпался Samsung SSD 870 QVO 2TB

 , ,


0

4

Пишу из горящего танка. Комп внезапно перезагрузился во время активной записи на диск. В журнале ошибки:

июн 21 18:10:37 abc kernel: BTRFS warning (device sda1): csum failed root 318 ino 39231141 off 105160704 csum 0x75d6d775 expected csum 0x4a24269a mirror 1
июн 21 18:10:37 abc kernel: BTRFS error (device sda1): bdev /dev/sda1 errs: wr 0, rd 0, flush 0, corrupt 1, gen 0
июн 21 18:10:37 abc kernel: BTRFS warning (device sda1): csum failed root 318 ino 39231141 off 105164800 csum 0x8298fde5 expected csum 0x2d726d5d mirror 1

Выкидывать его или забить и продолжить использовать пока совсем плохо не станет? После перезагрузки пока что работает. Как узнать на каком файле произошла ошибка? trim регулярно запускается.

P.S. на этом диске у меня swap

P.S. P.S.

uname -a
Linux abc 6.3.4-arch1-1 #1 SMP PREEMPT_DYNAMIC Wed, 24 May 2023 17:44:00 +0000 x86_64 GNU/Linux

sudo smartctl -a /dev/sda              
smartctl 7.3 2022-02-28 r5338 [x86_64-linux-6.3.4-arch1-1] (local build)
Copyright (C) 2002-22, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Samsung based SSDs
Device Model:     Samsung SSD 870 QVO 2TB
Serial Number:    S5SUNF0NC11331N
LU WWN Device Id: 5 002538 f40c044dd
Firmware Version: SVQ01B6Q
User Capacity:    2 000 398 934 016 bytes [2,00 TB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Form Factor:      2.5 inches
TRIM Command:     Available, deterministic, zeroed
Device is:        In smartctl database 7.3/5319
ATA Version is:   ACS-4 T13/BSR INCITS 529 revision 5
SATA Version is:  SATA 3.3, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Wed Jun 21 18:12:46 2023 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                (    0) seconds.
Offline data collection
capabilities:                    (0x53) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        No Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 160) minutes.
SCT capabilities:              (0x003d) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   097   097   000    Old_age   Always       -       11228
 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       525
177 Wear_Leveling_Count     0x0013   099   099   000    Pre-fail  Always       -       10
179 Used_Rsvd_Blk_Cnt_Tot   0x0013   100   100   010    Pre-fail  Always       -       0
181 Program_Fail_Cnt_Total  0x0032   100   100   010    Old_age   Always       -       0
182 Erase_Fail_Count_Total  0x0032   100   100   010    Old_age   Always       -       0
183 Runtime_Bad_Block       0x0013   100   100   010    Pre-fail  Always       -       0
187 Uncorrectable_Error_Cnt 0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0032   063   042   000    Old_age   Always       -       37
195 ECC_Error_Rate          0x001a   200   200   000    Old_age   Always       -       0
199 CRC_Error_Count         0x003e   100   100   000    Old_age   Always       -       0
235 POR_Recovery_Count      0x0012   099   099   000    Old_age   Always       -       30
241 Total_LBAs_Written      0x0032   099   099   000    Old_age   Always       -       40050852631

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
  256        0    65535  Read_scanning was never started
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
★★★★★

Последнее исправление: ox55ff (всего исправлений: 1)

в гугле вижу что ошибка встречается в рейде. Самое главное забыл упомянуть? Небось еще диски выдергивал, переназначивал или еще что. Имхо если делаешь манипуляции с бтрфс, то должен знать что делаешь. Иначе это поездка в один конец

monkdt
()
Ответ на: комментарий от ox55ff

Btrfs сама по себе не посыпется

ага-ага

Комп внезапно перезагрузился во время активной записи на диск

или вариант, что причина перезагрузки в диске?

vvn_black ★★★★★
()
Последнее исправление: vvn_black (всего исправлений: 1)
Ответ на: комментарий от utanho

нет на самом деле btrfs очень стабильная если не экспериментировать всякими левыми ее возможностями. Редхат никогда не говорил почему сделал btrfs деприкейтед, но мне очень интересно из-за чего он ее напнул. Ведь в федоре она так и осталась по умолчанию.

Правда есть, но она где-то очень глубоко

monkdt
()
Ответ на: комментарий от monkdt

btrfs увы цвета бурого и пахнет не шоколадом. Поэтому на федорохомячках ее можно продолжать обкатывать и дебажить, посыпется - ну и шут с ней. А редхат - коммерция. Посыпется - бэкап бэкапом а даже полдня простоя мультинациональной корпорации встанет красной шапочке в круглую сумму.

Qui-Gon ★★★★★
()
Ответ на: комментарий от monkdt

То, что удобно Фейсбуку, может быть неприемлемо для обычного пользователя. Может у них так процессы поставлены, что отказ btrfs – это штатная ситуация, которая решается автоматически. И фичи это перевешивают.

MoldAndLimeHoney
()
Ответ на: комментарий от MoldAndLimeHoney

да ладно. Самый что-ни есть базис Всея Фейсбука файловая система и мириться с постоянными падениями? Никакие фичи это не оправдают. Правильно сказал Qui-Gon простой никто не потерпит. У нас однажды на quelle.de был магазин офлайн 2 часа и всем вставили по самое небалуй

monkdt
()
Ответ на: комментарий от vvn_black

Комп внезапно перезагрузился во время активной записи на диск

или вариант, что причина перезагрузки в диске?

Или в sata контроллере или в мозгах или...

anc ★★★★★
()
Ответ на: комментарий от monkdt

Ну ваши (наши) высеры в фейсбухе волнуют всех очень мало ровно с того момента когда все это говно было проглочено и систематизировано нейросетью. Не жалков общем. Говнодате - говнофс. А вот результаты алхимического превращения дерьма в золото вангую хранятся в более надежном месте.

Qui-Gon ★★★★★
()
Ответ на: комментарий от monkdt

Что фейсбук применяет ее в огроменных масштабах

И что? Применение фс, применению фс рознь. Например фс может быть очень быстрой, но с эффектом возможной потери данных, или наоборот медленной но без возможных потерь. Как гриться «suum cuique».

anc ★★★★★
()
Ответ на: комментарий от monkdt

Самый что-ни есть базис Всея Фейсбука файловая система и мириться с постоянными падениями?

Why not? Начиная от «Быстро поднятое не считается упавшим», заканчивая «Есть резервирование, поэтому упавшая нода не страшно».

anc ★★★★★
()

не, все так рьяно бросились обсирать бтрфс как-будто самая худшая система из всех. Бедный фейсбук ( на котором у меня кстати даже аккаунта нет ) колется но продолжает жрать кактус. Есть статистика по страшным падениям в отличии от других файловых систем?

monkdt
()
Ответ на: комментарий от monkdt

это как бы непрофессиональные аргументы.

Ну смотря какая у вас профессия. Я вот психолог. И с точки зрения наше професии вполне себе профессиональные.

Qui-Gon ★★★★★
()
Ответ на: комментарий от monkdt

не, все так рьяно бросились обсирать бтрфс как-будто самая худшая система из всех.

btrfs это штука имеющая свои границы применимости. Как квантовая физика. По идее вещь хорошая - но если бы скажем прочность строительнх конструкций пытались рассчитать исходя из квантовых принципов а не эмпирически-ненаучного сопромата то мы бы до сих пор жили в пешерах.

Фейсбук знает как и для чего btrfs применять. И как ее обслуживать - вовремя. А вот пионер Вася Пупкин прочитав что фейсбук юзает btrfs и поставив ее по дефолту на домашний ноут скорее всего получит вот это.

Qui-Gon ★★★★★
()
Ответ на: комментарий от Qui-Gon

да не получит. У меня она стоит уже очень давно и абсолютно ничего не происходит. Более того сколько раз у меня было что f2fs на сд карте отваливалась с полной потерей данных, а с бтрфс, которая для нее вроде не подходит, все до сих пор нормально

Понимаю, что субъективно, но то что у меня без проблем длительное время на разных носителях говорит само за себя. Если начинаю эксприментировать со всякими рейдами/cнапшотами там начинаются проблемы. Ощущение, что хотели впихнуть невпихуемое и перестарались

monkdt
()
Ответ на: комментарий от monkdt

Если начинаю эксприментировать со всякими рейдами/cнапшотами там начинаются проблемы.

Я собираю кучу докер образов. И они на btrfs разделе хранятся. Я так понял в виде снапшотов. И как раз во время сборки очередного образа произошла эта история.

ox55ff ★★★★★
() автор топика
Ответ на: комментарий от ox55ff

тут не спорю. Надо было логи смотреть на предмет ошибок фс и вопрос диском отпал бы сразу.

Хотя сделай как говорят smart тесты, может произойдет чудо и придется выкинуть дорогущий ссд от скомпрометировавшего себя самсунга

monkdt
()