LINUX.ORG.RU
ФорумAdmin

Забивается диск

 ,


0

2

При банальном копирвовании бэкапа по фтп полностью забивается диск сервера (centos 6.5, ext4). Пробовал копировать и по ssh (в mc через фтп) - тоже самое.

atop выдает загрузку дисков (2 террабайтника в рейде) в 100%

Памяти 4 гига, один из файлов бэкапа 3 гига :-)

Как то это лечится или пора уже память наращивать?


Операционная система ? Файловая система ? Драйверы ? Контроллеры ?

Телепаты в отпусках! Увы и Ах !

robot12 ★★★★★ ()
Ответ на: комментарий от Pinkbyte

iotop не показывает чего либо аномального.

Filesystem      Size  Used Avail Use% Mounted on
/dev/md2        909G  111G  752G  13% /
tmpfs           1.9G     0  1.9G   0% /dev/shm
/dev/md0        985M  125M  810M  14% /boot
emva ()
Ответ на: комментарий от anonymous
Filesystem       Inodes   IUsed    IFree IUse% Mounted on
/dev/md2       60465152 1882443 58582709    4% /
tmpfs            478368       1   478367    1% /dev/shm
/dev/md0          64000      62    63938    1% /boot
emva ()

Видя происходящее в треде, невольно хочется спросить: что значит «забивается», и какие признаки заставили тебя считать, что диск «забивается»?

anonymous ()
Ответ на: комментарий от Pinkbyte
 mdadm -D /dev/md0
/dev/md0:
        Version : 1.0
  Creation Time : Wed May 14 15:10:32 2014
     Raid Level : raid1
     Array Size : 1023936 (1000.11 MiB 1048.51 MB)
  Used Dev Size : 1023936 (1000.11 MiB 1048.51 MB)
   Raid Devices : 2
  Total Devices : 2
    Persistence : Superblock is persistent

    Update Time : Tue May 26 13:23:18 2015
          State : clean
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0

           Name : stars:0
           UUID : c47bc3ec:1d4e6226:4ac82156:92670bb2
         Events : 181

    Number   Major   Minor   RaidDevice State
       0       8        1        0      active sync   /dev/sda1
       1       8       17        1      active sync   /dev/sdb1

emva ()
Ответ на: комментарий от Pinkbyte
mdadm -D /dev/md2
/dev/md2:
        Version : 1.1
  Creation Time : Wed May 14 15:10:33 2014
     Raid Level : raid1
     Array Size : 967413568 (922.60 GiB 990.63 GB)
  Used Dev Size : 967413568 (922.60 GiB 990.63 GB)
   Raid Devices : 2
  Total Devices : 2
    Persistence : Superblock is persistent

  Intent Bitmap : Internal

    Update Time : Wed May 27 15:43:00 2015
          State : active
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0

           Name : stars:2
           UUID : 586a9b73:31aff2d0:f05e4293:c0b509f0
         Events : 885986

    Number   Major   Minor   RaidDevice State
       0       8        3        0      active sync   /dev/sda3
       1       8       19        1      active sync   /dev/sdb3
emva ()
Ответ на: комментарий от Pinkbyte
mdadm -D /dev/md1
/dev/md1:
        Version : 1.1
  Creation Time : Wed May 14 15:10:33 2014
     Raid Level : raid1
     Array Size : 8187840 (7.81 GiB 8.38 GB)
  Used Dev Size : 8187840 (7.81 GiB 8.38 GB)
   Raid Devices : 2
  Total Devices : 2
    Persistence : Superblock is persistent

    Update Time : Wed May 27 17:02:27 2015
          State : clean
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0

           Name : stars:1
           UUID : cda089ba:b82b5f1e:1b05cc6a:4e6b99d6
         Events : 278

    Number   Major   Minor   RaidDevice State
       0       8        2        0      active sync   /dev/sda2
       1       8       18        1      active sync   /dev/sdb2
emva ()
Ответ на: комментарий от emva

Продолжаем ванговать: smartctl -i на оба диска и дай вывод, может к одному из дисков песец пришёл.
Заодно посмотрим что за диски там.

smvm ()
Ответ на: комментарий от smvm

Со смартцтл все нормально - их смотрел в первую очередь

cat /proc/mdstat
Personalities : [raid1]
md0 : active raid1 sdb1[1] sda1[0]
      1023936 blocks super 1.0 [2/2] [UU]

md2 : active raid1 sda3[0] sdb3[1]
      967413568 blocks super 1.1 [2/2] [UU]
      bitmap: 6/8 pages [24KB], 65536KB chunk

md1 : active raid1 sda2[0] sdb2[1]
      8187840 blocks super 1.1 [2/2] [UU]

unused devices: <none>

emva ()
Ответ на: комментарий от smvm
=== START OF INFORMATION SECTION ===
Model Family:     Hitachi Ultrastar A7K2000
Device Model:     Hitachi HUA722010CLA330
Serial Number:    JPW9J0N111Z5PV
LU WWN Device Id: 5 000cca 39ccefd2e
Firmware Version: JP4OA3EA
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Thu May 28 00:54:48 2015 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled


=== START OF INFORMATION SECTION ===
Model Family:     Hitachi Ultrastar A7K2000
Device Model:     Hitachi HUA722010CLA330
Serial Number:    JPW9J0N111YJNV
LU WWN Device Id: 5 000cca 39ccefac1
Firmware Version: JP4OA3EA
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Thu May 28 00:55:13 2015 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
emva ()
Ответ на: комментарий от emva

Ну и до кучи:

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   098   098   016    Pre-fail  Always       -       131075
  2 Throughput_Performance  0x0005   136   136   054    Pre-fail  Offline      -       92
  3 Spin_Up_Time            0x0007   137   137   024    Pre-fail  Always       -       279 (Average 274)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       25
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   140   140   020    Pre-fail  Offline      -       30
  9 Power_On_Hours          0x0012   098   098   000    Old_age   Always       -       16933
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       25
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       152
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       152
194 Temperature_Celsius     0x0002   200   200   000    Old_age   Always       -       30 (Min/Max 18/38)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0


=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   135   135   054    Pre-fail  Offline      -       96
  3 Spin_Up_Time            0x0007   141   141   024    Pre-fail  Always       -       253 (Average 285)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       57
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   140   140   020    Pre-fail  Offline      -       30
  9 Power_On_Hours          0x0012   098   098   000    Old_age   Always       -       16942
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       57
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       189
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       189
194 Temperature_Celsius     0x0002   200   200   000    Old_age   Always       -       30 (Min/Max 18/40)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0
emva ()
Ответ на: комментарий от emva

Тут уж точно остаётся только гадать на кофейной гуще. Попробуй убрать нагрузку на диски и проверить скорость чтения через hdparm -t и скорость записи 2Гб на диск
sync;time bash -c "(dd if=/dev/zero of=bf bs=4k count=500000; sync)"
Во время заливки бэкапа на сервер в atop -d 1 только процесс ftp/sftp жрёт диск?

smvm ()
Ответ на: комментарий от smvm

Причем фишка в том, что не заливки на сервер, а чтения с сервера. Т.е. он не пишет, а только читает.

emva ()
Ответ на: комментарий от aol

Прежде чем иронизировать, почитали бы про производителей дисков и поля Raw_Read_Error_Rate....

emva ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.