Все добрый.
Centos 5.7. Сервер под бэкап, soft raid 6 (4 диска); был неожиданный ребут, апосля xfs, крутившийся на разделе потерял часть данных, переформатил раздел в ext4; проработало недели 2, сегодня в логах
EXT4-fs error (device md2): ext4_lookup: deleted inode referenced: 114205457
EXT4-fs error (device md2): ext4_lookup: deleted inode referenced: 113967281
EXT4-fs error (device md2): ext4_lookup: deleted inode referenced: 184009073
EXT4-fs error (device md2): ext4_lookup: deleted inode referenced: 184017329
EXT4-fs error (device md2): ext4_lookup: deleted inode referenced: 182911313
...
smartctl --all /dev/sd[abcd]
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       10
  3 Spin_Up_Time            0x0027   253   253   021    Pre-fail  Always       -       8916
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       15
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   094   094   000    Old_age   Always       -       4960
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       13
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       11
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       3
194 Temperature_Celsius     0x0022   113   102   000    Old_age   Always       -       39
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0
для всех дисков Raw_Read_Error_Rate не нуль, максимальное значение 22; диски wd, в интернетах говорят что мол значение несколько единиц/десятков для любого диска это нормально; хз насколько это верно.
Если ошибка на диске - почему raid не просёк их? Если предположить что raid не зафакапил, остаётся что проблема в ext4.
Ваши идеи, что делать. Xfs до сих пор теряет данные (которые уже сто лет лежат на диске) при внезапном отключении эл-ва, да и медленный на миллионах файлах; ext3/jfs/btrfs не в счёт, рейзер...хз что с ним, уже не пилят его особо.




