LINUX.ORG.RU

Вжух и ФС в фарш

 , , ,


0

2

Никого не трогаю, играю в танки через виртуалку и вжух... виртуалка зависает, переключаюсь в хост (Debian 9) и вижу что корень в read-only. Система стоит на Samsung 850 PRO. Перезагружаюсь и меня сходу встречает initramfs с просьбой выполнить fsck для корня. Ну я с дуру и выполнил - ведь такие ситуации в последнее время стали вылетать пару раз в месяц и я думал что и в этот раз повезёт. Причём он очень много «исправлял» (как потом оказалось - в фарш). После он радостный сообщил что все ошибки ФС исправлены и можно перезагружаться. А после перезагрузки система запустилась кое-как, с половиной сервисов в fail. А что с ФС? Почти всё в кашу. Сама ФС ext4. Использовался discard (где-то на здесь слышал что есть какой-то баг в прошивках Samsung SSD если использовать TRIM, но я же идиот и просто проигнорировал этот ахтунг). Ну хоть образ с виртуалкой целый и я смогу сейчас доиграть в танчики. А по утру надо переустанавливать систему.

И сейчас увидел забавные строчки в syslog за сегодня:

 [   29.802899] IO_PAGE_FAULT device=00:11.0 domain=0x0006 address=0x00000000fe928380 flags=0x0050]
[   30.240144] IOTLB_INV_TIMEOUT device=01:00.0 address=0x000000042d693cf0]
nullnullnullnullnullnullnullnullnullnullnullnullnullnullnullnull

На этом самом «null» система видимо и перешла в режим read-only, а своим fsck я угробил её до конца.

Да, я идиот, но может кто подкинуть идеи из-за чего вообще она могла перейти в read-only? Сам диск новый, ничего особо на него не писалось.

Перемещено leave из admin

Использовался discard (где-то на здесь слышал что есть какой-то баг в прошивках Samsung SSD если использовать TRIM, но я же идиот и просто проигнорировал этот ахтунг).

У меня тоже discard, но ничего такого не было:

=== START OF INFORMATION SECTION ===
Device Model:     Samsung SSD 850 120GB
Serial Number:    S3WBNF0JB16803P
LU WWN Device Id: 5 002538 d426a3da9
Firmware Version: MVT01B6Q
User Capacity:    120 034 123 776 bytes [120 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Form Factor:      2.5 inches
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-2, ATA8-ACS T13/1699-D revision 4c
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Fri Feb  9 04:24:46 2018 +06
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

RedEyedMan4 ★★★★★ ()
IO_PAGE_FAULT
IOTLB_INV_TIMEOUT

В этом вряд ли виноват ssd

Для работы TRIM хватает fstrim в кроне.

И вообще-то blacklist для конкретных моделей ssd должен быть в ядре

Не знаю, как для PRO; при наличии EVO в dmesg есть строчки

ata2.00: disabling queued TRIM support

greenman ★★★★★ ()
Последнее исправление: greenman (всего исправлений: 1)

fsck для корня ... такие ситуации в последнее время стали вылетать пару раз в месяц

Вот это точно ненормально. Сразу надо было искать причину.

greenman ★★★★★ ()

Недавно получил ext4 «в кашу» на ноуте с ubuntu 16.04. Ничего не делал, просто стояло включенным, пока я спал. Пришел - оно «в кашу». Это похоже на баг в ядре.

PS. ssd intel
PPS. smart ok

targitaj ★★★ ()
Последнее исправление: targitaj (всего исправлений: 2)
Ответ на: комментарий от FluffyPillow

В виртуалке? Сколько fps? Какая конфигурация железа?

Блин, если бы я мог запускать танки в виртуалке прошлым летом то фиг бы я диплом защитил, дошел до кв1с, увлекся артой,а они уроды такие понерфили ее, донатные уроды. Я и ушел нафиг

karton1 ★★★ ()
Последнее исправление: karton1 (всего исправлений: 1)
Ответ на: комментарий от greenman

Для работы TRIM хватает fstrim в кроне.

Типа того. Этак раз в неделю в той же ubuntu по умолчанию в кроне стоит fstrim. И не надо больше ничего выдумывать.

Ну всё же написано https://wiki.debian.org/SSDOptimization

First read the WARNING at the top of this page. If desirable, enable the «discard» filesystem options for automatic online TRIM. Alternatively, and often not recommended[/d]: Set «discard» mount option in /etc/fstab for the ext4 filesystem, swap partition, Btrfs, etc

anonymous ()

у тебя могла пролететь дикая частица и ионизировать какой-нибудь транзистор в чипсете. вжух и у тебя device=00:11.0 уже пишет не туда в оперативку. вжух вжух вжух и полезли null

ckotinko ★★☆ ()
Ответ на: комментарий от anonymous

это нищенский 5x0 series?

У меня был нищенский OCZ Vertex 4. Замучался от постоянно битой EXT4.

Потом был нищенский Intel 530. Тоже самое...

Оба подарил знакомым на венде - отлично работают уже какой год.

Себе купил Intel 730 (или какой там) на 256 ГБ под корень и Samsung 850 PRO на 1ТБ. Уже пару лет нормально.

Но глючное ядро я бы всё же не исключал бы.

anonymous ()
Ответ на: комментарий от mir-inoy

Почитал про trim на 8xx серии, и да, все прошивки имеют баг который может приводить к повреждению данных.

Либо не юзать вообще trim, либо переходить на окошки полностью.

FluffyPillow ()
Последнее исправление: FluffyPillow (всего исправлений: 1)