LINUX.ORG.RU

LVM - умер один из дисков

 , ,


0

2

Умер один из дисков в lvm. Сможет ли система после выключения загрузиться, если корень находится в vg, которая не пересекается с умершим диском?

В лог внезапно начало сыпаться такое:

Read(16): 88 00 00 00 00 00 1f af a5 90 00 00 00 08 00 00
sd 6:0:0:0: [sdc]  
Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK

dd if=/dev/sdc of=/dev/null
dd: error reading ‘/dev/sdc’: Input/output error
0+0 records in
0+0 records out
0 bytes (0 B) copied, 0.00103421 s, 0.0 kB/s
smartctl -a -T permissive /dev/sdc
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-96-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Vendor:               /6:0:0:0
Product:              
User Capacity:        600,332,565,813,390,450 bytes [600 PB]
Logical block size:   774843950 bytes
>> Terminate command early due to bad response to IEC mode page

=== START OF READ SMART DATA SECTION ===

Error Counter logging not supported

Device does not support Self Test logging

Похоже проблемы не с бэдами, а с электроникой?


Ответ на: комментарий от Deleted

hdd. Перезагрузился - диск воскрес. Чтоэтобыло? Подлежит ли диск выбросу из окна или проблема могла быть не в нем?

smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-101-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red (AF)
Device Model:     WDC WD30EFRX-68EUZN0
Serial Number:    WD-WMC4N0524543
LU WWN Device Id: 5 0014ee 6ae7a9ce6
Firmware Version: 80.00A80
User Capacity:    3,000,592,982,016 bytes [3.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Mon Nov 21 10:15:01 2016 EET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                (42480) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 426) minutes.
Conveyance self-test routine
recommended polling time:        (   5) minutes.
SCT capabilities:              (0x703d) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   190   176   021    Pre-fail  Always       -       5475
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       112
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   067   067   000    Old_age   Always       -       24749
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       112
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       105
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       6
194 Temperature_Celsius     0x0022   114   098   000    Old_age   Always       -       36
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       37
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Ower
() автор топика
Ответ на: комментарий от Ower

Чтоэтобыло?

Да что угодно. Обновляй прошивки.

Подлежит ли диск выбросу из окна или проблема могла быть не в нем?

smartctl -t short/long, да и то не скажет.

Ну и БП проверь.

UDMA_CRC_Error_Count 137

Кабель замени.

Deleted
()
Последнее исправление: Deleted (всего исправлений: 1)
Ответ на: комментарий от Ower

Я бы сначала кабель заменил. Диски просто так не отваливаются. Ну и пока оно видится нагрузи его тем же чтением в null. И попутно данные на живой диск мигрируй. Еще питание проверь. Power-Off_Retract_Count = 105. Так много раз свет рубали?

Radjah ★★★★★
()

LVM - умер один из дисков

LVM не оперирует понятием «диск».
Дальше не читал.

mos ★★☆☆☆
()
Ответ на: комментарий от Ower

Reallocated_Sector_Ct, Current_Pending_Sector и Offline_Uncorrectable - по нолям. Диск живой.

UDMA_CRC_Error_Count >0 - как уже подсказали - меняй кабель.

Pinkbyte ★★★★★
()

Удваиваю про кабель. У мну что-такое было, кабель заменил и норм. Но конкретно не скажу - давно уже было.

Deleted
()

Всем спасибо. Попробую выбросить кабель из окна :)

Ower
() автор топика

Периодически бывает что «пропадает» системный диск. Всегда после заглядывания внутрь системника. Отходит sata кабелёк.

SergeySVold ★★★★
()

Купи нормальный SATA-кабель с защёлками.

h578b1bde ★☆
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.