LINUX.ORG.RU

НЖМД начал щёлкать после двухнедельного простоя

 


0

1

В декабре прошлого года купил два диска «Toshiba PC P300 1TB», собрал из них RAID-1. Эксплуатировал не особо сильно. Домашний ПК, на котором я в основном интернеты читаю и разрабатываю. На две недели уезжал в отпуск, полностью обесточил ЭВМ, вынул шнур питания сетевого фильтра из розетки. Сейчас включил и слышу это на одном из дисков.

Диск определяется, система работает но подлагивает из-за данной проблемы. Я решил отключить (физически) щёлкающую железяку. Чего ещё сделать/посмотреть?

Наверное лучше не жмотиться и купить новый диск, а этот раздолбать (есть конфиденциальные данные, не всё зашифровано)?

smartctl 6.5 2016-05-07 r4318 [x86_64-linux-4.4.14] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     TOSHIBA HDWD110
Serial Number:    68KSUDMFS
LU WWN Device Id: 5 000039 fd6f51a6c
Firmware Version: MS2OA8R0
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Sat Jul 13 21:23:10 2019 YEKT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x80)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      ( 121)	The previous self-test completed having
					the read element of the test failed.
Total time to complete Offline 
data collection: 		( 7604) seconds.
Offline data collection
capabilities: 			 (0x5b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					No Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 ( 127) minutes.
SCT capabilities: 	       (0x003d)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   054    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0007   124   124   024    Pre-fail  Always       -       185 (Average 185)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       268
  5 Reallocated_Sector_Ct   0x0033   059   059   005    Pre-fail  Always       -       833
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   020    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0012   100   100   000    Old_age   Always       -       1859
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       265
192 Power-Off_Retract_Count 0x0032   099   099   000    Old_age   Always       -       2019
193 Load_Cycle_Count        0x0012   099   099   000    Old_age   Always       -       2019
194 Temperature_Celsius     0x0002   142   142   000    Old_age   Always       -       42 (Min/Max 22/43)
196 Reallocated_Event_Count 0x0032   016   016   000    Old_age   Always       -       1699
197 Current_Pending_Sector  0x0022   081   081   000    Old_age   Always       -       544
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0

SMART Error Log Version: 1
ATA Error Count: 6 (device log contains only the most recent five errors)
	CR = Command Register [HEX]
	FR = Features Register [HEX]
	SC = Sector Count Register [HEX]
	SN = Sector Number Register [HEX]
	CL = Cylinder Low Register [HEX]
	CH = Cylinder High Register [HEX]
	DH = Device/Head Register [HEX]
	DC = Device Command Register [HEX]
	ER = Error register [HEX]
	ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 6 occurred at disk power-on lifetime: 1846 hours (76 days + 22 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 98 2f d6 03  Error: UNC at LBA = 0x03d62f98 = 64368536

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 d0 98 2f d6 40 00   1d+17:53:16.206  READ FPDMA QUEUED
  60 08 c8 90 2f d6 40 00   1d+17:53:16.163  READ FPDMA QUEUED
  61 c0 c0 f0 26 c8 40 00   1d+17:53:16.161  WRITE FPDMA QUEUED
  ea 00 00 00 00 00 a0 00   1d+17:53:16.144  FLUSH CACHE EXT
  61 05 b0 88 87 6c 40 00   1d+17:53:16.144  WRITE FPDMA QUEUED

Error 5 occurred at disk power-on lifetime: 1846 hours (76 days + 22 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 98 2f d6 03  Error: UNC at LBA = 0x03d62f98 = 64368536

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 10 e0 90 2f d6 40 00   1d+17:53:12.130  READ FPDMA QUEUED
  ea 00 00 00 00 00 a0 00   1d+17:53:12.049  FLUSH CACHE EXT
  61 10 d0 a0 f5 79 40 00   1d+17:53:12.049  WRITE FPDMA QUEUED
  61 08 c8 90 91 c6 40 00   1d+17:53:11.980  WRITE FPDMA QUEUED
  61 08 c0 88 91 c6 40 00   1d+17:53:11.945  WRITE FPDMA QUEUED

Error 4 occurred at disk power-on lifetime: 1845 hours (76 days + 21 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 b8 4c d6 03  Error: UNC at LBA = 0x03d64cb8 = 64375992

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 48 b8 4c d6 40 00   1d+16:43:18.166  READ FPDMA QUEUED
  60 08 40 b0 4c d6 40 00   1d+16:43:18.166  READ FPDMA QUEUED
  60 08 38 a8 4c d6 40 00   1d+16:43:18.166  READ FPDMA QUEUED
  60 08 30 a0 4c d6 40 00   1d+16:43:18.141  READ FPDMA QUEUED
  ea 00 00 00 00 00 a0 00   1d+16:43:18.133  FLUSH CACHE EXT

Error 3 occurred at disk power-on lifetime: 1845 hours (76 days + 21 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 b8 4c d6 03  Error: UNC at LBA = 0x03d64cb8 = 64375992

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 20 88 a0 4c d6 40 00   1d+16:43:14.157  READ FPDMA QUEUED
  60 20 80 80 4c d6 40 00   1d+16:43:14.152  READ FPDMA QUEUED
  60 20 78 d8 b6 d0 40 00   1d+16:43:14.146  READ FPDMA QUEUED
  60 10 70 b8 b6 d0 40 00   1d+16:43:14.146  READ FPDMA QUEUED
  60 10 68 c8 b6 d0 40 00   1d+16:43:14.146  READ FPDMA QUEUED

Error 2 occurred at disk power-on lifetime: 1845 hours (76 days + 21 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 98 7e d6 03  Error: UNC at LBA = 0x03d67e98 = 64388760

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 c8 98 7e d6 40 00   1d+16:41:25.262  READ FPDMA QUEUED
  60 08 c0 90 7e d6 40 00   1d+16:41:25.237  READ FPDMA QUEUED
  ea 00 00 00 00 00 a0 00   1d+16:41:25.229  FLUSH CACHE EXT
  61 08 b0 80 87 6c 40 00   1d+16:41:25.229  WRITE FPDMA QUEUED
  ea 00 00 00 00 00 a0 00   1d+16:41:25.229  FLUSH CACHE EXT

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       90%      1859         1135522584
# 2  Extended offline    Aborted by host               90%      1859         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

smartctl -a в помощь.

проблема может быть и из-за БП (вернее, китайского муляжа БП), и из-за разъемов (особенно если питание через китайпереходники молекс-сата).

NiTr0 ★★★★★ ()

есть конфиденциальные данные

Сделай dd if=/dev/zero of=/dev/sdX bs=4096*. Для большей гарантии можешь сделать dd if=/dev/random of=/dev/sdX bs=4096* и пересоздать ФС с кинцами, как советовал анон.

* — главное не спутать диск.

Grzegorz ()
Ответ на: комментарий от Grzegorz

/dev/random

Держите такие советы при себе.

А для очистки диска есть ATA Secure Erase, ну или shred, но если диск умирает, то может недотянуть до конца (или вообще ничего не сделать, если головы неисправны).

legolegs ★★★★★ ()

Ага у меня на сутки отключение было (света), пк больше не включился. Не обесточивайте ПК. :) А в чём фича таких крохотных дисков? Если уж берёте копеечные диски, собирайте нормальный рейд штук из 10.

anonymous ()
Ответ на: комментарий от Grzegorz

Принципиальная - ни в чём. А вот между /dev/random и /dev/urandom разница есть - первый очень медленный и блокируется на время сбора энтропии.

legolegs ★★★★★ ()
Последнее исправление: legolegs (всего исправлений: 1)

На FreeBSD

После установки из порта sysutils/ataidle в /etc/rc.conf для SATA-дисков прописал:

# sysutils/ataidle
ataidle_enable="YES"
ataidle_devices="ada2 ada3 ada5"
ataidle_ada2="-P 254"
ataidle_ada3="-P 254"
ataidle_ada5="-P 254"
Щелчки (автопарковка) головок исчезла.

iZEN ★★★★★ ()
Ответ на: На FreeBSD от iZEN

А в линуксах это

# /etc/conf.d/hdparm: config file for /etc/init.d/hdparm

#
# Note that options such as -y which force *immediate* power saving options
# should generally not be placed here.  The hdparm init.d script may run at
# anytime with respect to other init.d scripts that do system wide drive
# scans (like the hald script), so they will merely get spun right back up.
# If you wish to use these options, please use the local.start init.d script
# instead so that you're guaranteed that it will run last.
#

# You can either set hdparm arguments for each drive using hdX_args,
# discX_args, cdromX_args and genericX_args, e.g.
#
# hda_args="-d1 -X66"
# disc1_args="-d1"
# cdrom0_args="-d1"

# or you can set options for all PATA drives
pata_all_args="-d1"

# or you can set options for all SATA drives
sata_all_args="-M 254 -u 1 -W 1"

# or, you can set hdparm options for all drives
all_args=""
RedEyedMan4 ★★★★★ ()
Ответ на: комментарий от RedEyedMan4

Почему вас это беспокоит? А перегревы... Рабочая температура что-то до 65-75 в зависимости от производителя и технологии, согласно датчику у меня ни разу ещё выше 60 не поднималось.

anonymous ()
Ответ на: комментарий от anonymous

Почему вас это беспокоит?

Так лето же. Жара +45. А харды у меня выше 45 не греются, но это у меня видюха не кипятильник. С кипятильником было и 60 у хардов.

RedEyedMan4 ★★★★★ ()
Последнее исправление: RedEyedMan4 (всего исправлений: 1)

Это ж прекрасно когда он щёлкает и трещит, особенно музыкально. Работает, чертяка! Вот когда трещать перестаёт, это уже повод для беспокойства. А так, может рекалибрацию проводит, или самодиагностику. Что тут обсуждать, без выполненых смарт-тестов? У вас есть оборудование чтобы подцепиться к инженерному выводу? Ну можете попробовать тогда.

anonymous ()

В процессе проверки на плохие блоки, диск совсем посыпался. Теперь не определяется даже. На него гарантия 24 месяца, но отдать в ремонт нельзя :(

Вывод можно только один сделать: шифруйте данные, господа.

Спасибо всем кто ответил.

perl5_guy ()
Последнее исправление: perl5_guy (всего исправлений: 1)
Ответ на: комментарий от perl5_guy

Ну это не спасёт, у меня тоже гарантия 5 лет была, и на 4 году когда она понадобилась Юлмарт сдулся. Перед тем ещё 3 магазина были. Вот так возьмёшь теперь в Ретарде, и он через 2 года закроется.

anonymous ()