LINUX.ORG.RU

Умирает ссд?

 ,


1

1

Вчера ковырялся с osm. Импортировал карту в постгресс.
osm2pgsql --slim -d gis -C 3600 --hstore -S openstreetmap-carto-2.41.0/openstreetmap-carto.style great-britain-latest.osm.pbf

Это команде может не хватить 8 гб оперативки(с рекоменд. значением кеша 3600). Поэтому, кроме теребления ссд при импорте базы, эта команда яростно теребит ещё и своп(возможно). Вполне возможно, что ссд не понравилось такое опускание, или его братку контроллеру и он мне подвесил ОС. два раза. вчера, где то в конце выполнения этой команды. Маджик кейс даже не реагируют, для ребута. После хардребута кнопочкой на корпусе, биос задумчиво открывает мне пустое окно с информацией о сата-накопителях, где...пусто! простое выключение, подождать секунд 10 и включение мне помогло вчера и сегодня. ссд определился. но уже второй раз, что натолкнуло на вполне определённые мысли. либо контроллер не выдерживает io, (греется?), либо ссд дохнет?

Резюмирую: двойная нагрузка на ссд: работа с БД + жёсткий своп. Зависание.
биос временно не видит ссд.

Ответ на: комментарий от darkenshvein

Ну для начала было бы не плохо хотя бы модель диска назвать. А вообще, твой SSD греется почти наверняка и ему будет достаточно всего лишь дополнительного обдува. Хотя, если он не греется - печальный симптом, пора бэкап настраивать, если еще не сделал.

Deleted
()
Ответ на: комментарий от Deleted

ему будет достаточно всего лишь дополнительного обдува.

я сильно сомневаюсь, что :
1. изготовитель реализовал передачу тепла на корпус
2. есть металлический корпус. скорее всего пластик. какой смысл от обдува негорячего пластика.

darkenshvein ★★★★★
() автор топика
Ответ на: комментарий от darkenshvein

Вскрыть не пробовал? Не, если диск на гарантии - тут другое. Но вообще, у меня SSD часто вскрываются и работают без корпуса. Так прохладнее )

Deleted
()
Ответ на: комментарий от darkenshvein

Ну если работодателя, то надо бы глянуть температурку, такой я вскрывать бы не стал. А касательно статики - да откуда она у тебя в системнике то возьмется? У меня в ноуте были пара вскрытых, работали замечательно, охлаждались лучше. Сейчас носитель так сильно не греется, поэтому не заморачивался.
Есть еще такое мнение - посмотреть на счет обновления прошивок для своей модельки. Бывает, исправляют всякие косяки.

Deleted
()

Да. У меня тоже самое было с Vertex 4. Но даже без такой крутой нагрузки. Просто отваливался этак раз в три дня. SMART отличный был.

Мучился, мучился этак с месяц. В итоге отдал его «вендузятнику» у него он отлично работает до сих пор.

Себе тупо купил другой.

fornlr ★★★★★
()
Последнее исправление: fornlr (всего исправлений: 3)
Ответ на: комментарий от Deleted

дисковая утилита не показывает на нём температуру.
а статика...как откуда возьмётся? от пыли же легко

darkenshvein ★★★★★
() автор топика

Скорее всего перегрев контроллера SSD. Проверь SMART во время долговременной нагрузки (копирование на SSD чего-то долгого). Обрати внимание на показания термодатчика. Критической температурой для SSD считается 75-80 градусов, некоторые работают и при 110, но это не есть хорошо - нужно принудительное охлаждение.

iZEN ★★★★★
()
Ответ на: комментарий от Deleted

пора бэкап настраивать, если еще не сделал

Или зеркало. В ZFS с горячей заменой вообще хорошо.

r3lgar ★★★★★
()
Ответ на: комментарий от darkenshvein

Статика не страшна распаянным и надёжно соединённым в схему электронным компонентам, поскольку сама схема спроектирована в том числе для борьбы с помехами и статическим напряжением. Модули DRAM и процессоры можно брать руками, не боясь дотронутся до контактов - это достижение грамотной схемотехники. А вот отдельные КМОП-транзисторы очень даже чувствительные и пробиваются от любого чиха статики.

iZEN ★★★★★
()
Ответ на: комментарий от darkenshvein

Эээ. Так не надо допускать кучу пыли.

Deleted
()
Ответ на: комментарий от Deleted

sudo smartctl -a /dev/sda
smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.15.0-34-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, http://www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family: Indilinx Barefoot_2/Everest/Martini based SSDs
Device Model: OCZ-VERTEX4
Serial Number: OCZ-9X7946N3XN1U531K
LU WWN Device Id: 5 e83a97 15251e916
Firmware Version: 1.5
User Capacity: 128 035 676 160 bytes [128 GB]
Sector Size: 512 bytes logical/physical
Rotation Rate: Solid State Device
Device is: In smartctl database [for details use: -P show]
ATA Version is: ACS-2 (minor revision not indicated)
SATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Thu Sep 27 09:32:42 2018 +03
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 25) The self-test routine was aborted by
the host.
Total time to complete Offline
data collection: ( 0) seconds.
Offline data collection
capabilities: (0x1d) SMART execute Offline immediate.
No Auto Offline data collection support.
Abort Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
No Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x00) Error logging NOT supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 0) minutes.
Extended self-test routine
recommended polling time: ( 0) minutes.

SMART Attributes Data Structure revision number: 18
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x0000 005 000 000 Old_age Offline - 5
3 Spin_Up_Time 0x0000 100 100 000 Old_age Offline - 0
4 Start_Stop_Count 0x0000 100 100 000 Old_age Offline - 0
5 Reallocated_Sector_Ct 0x0000 100 100 000 Old_age Offline - 0
9 Power_On_Hours 0x0000 100 100 000 Old_age Offline - 15718
12 Power_Cycle_Count 0x0000 100 100 000 Old_age Offline - 2655
232 Lifetime_Writes 0x0000 100 100 000 Old_age Offline - 24838557006
233 Media_Wearout_Indicator 0x0000 096 000 000 Old_age Offline - 96

SMART Error Log not supported

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Aborted by host 90% 0 -

Selective Self-tests/Logging not supported

darkenshvein ★★★★★
() автор топика
Ответ на: комментарий от Deleted

гы. индикатор селфтеста в гноме-диск-утил крутился, а smartmontools не были установлены)))

darkenshvein ★★★★★
() автор топика
Ответ на: комментарий от darkenshvein

233 Media_Wearout_Indicator 0x0000 096 000 000 Old_age Offline - 96

Да, единственный параметр, который хоть как-то может показать состояние диска, и он в порядке, походу. Я даже и не знаю, что сказать: у этого диска нет даже датчиков температуры судя по смарт. Ну прошивку обновить, если не поможет - я даже не представляю, что с ним делать.

Deleted
()
Ответ на: комментарий от Deleted

Ну сделай ему long тест. ВДруг не пройдет.

Deleted
()

обновить фирмварь забекапившись перед этим. не поможет - пичаль значит, OCZ - таки гуано. хоть и не такое лютое как vertex3 на сэндфорсе (с 20-30% гарантийных возвратов, хе-хе), но - гуано.

NiTr0 ★★★★★
()

Прошей. Не поможет - в мусорку/в гарантийку.

svinorezka
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.