LINUX.ORG.RU
ФорумAdmin

Висит check у mdadm

 , ,


0

3

Помогите плиз понять проблему:

Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10] 
md1 : active raid1 sda2[0] sdb2[1]
      1952857152 blocks super 1.2 [2/2] [UU]
      [>....................]  check =  1.6% (31981568/1952857152) finish=2047103.6min speed=15K/sec
      bitmap: 9/15 pages [36KB], 65536KB chunk

md0 : active raid1 sda1[0] sdb1[1]
      523712 blocks super 1.2 [2/2] [UU]

mdadm решил повеситься на чеке, не могу понять в чем проблема. Ошибок ata не валится, смарты в порядке, меняется bitmap: 9/15 pages [36KB], и цифры финиш/спид в сторону ухудшения.

# mdadm -D /dev/md1 
/dev/md1:
           Version : 1.2
     Creation Time : Tue Mar 12 23:07:36 2019
        Raid Level : raid1
        Array Size : 1952857152 (1862.39 GiB 1999.73 GB)
     Used Dev Size : 1952857152 (1862.39 GiB 1999.73 GB)
      Raid Devices : 2
     Total Devices : 2
       Persistence : Superblock is persistent

     Intent Bitmap : Internal

       Update Time : Thu Dec 12 09:23:37 2019
             State : active, checking 
    Active Devices : 2
   Working Devices : 2
    Failed Devices : 0
     Spare Devices : 0

Consistency Policy : bitmap

      Check Status : 1% complete

              Name : rescue:1
              UUID : 49a218e6:7178b5d6:33e49cfe:d9c0023f
            Events : 43551

    Number   Major   Minor   RaidDevice State
       0       8        2        0      active sync   /dev/sda2
       1       8       18        1      active sync   /dev/sdb2
★★★★★

Ошибок ata не валится

в dmesg ?

и цифры финиш/спид в сторону ухудшения

  1. проверка диска может работать медленнее, если идёт интенсивная работа с дисками. см. «%util» в

iostat -x 10 /dev/sd?

также сравни другие значения на обоих дисках. по идее они не должны сильно отличаться. но конкретных порогов ( где аномалия а где ещё норма ) не назову

  1. также емнип на проверку влияют те же лимиты, что и на ребилд. посмотри

sysctl -a | grep dev.raid.speed_limit

эти параметры в килобайтах

  1. хотя 15кб/с это как-то совсем жестоко. я бы поставил на проблемы с диском, на втором месте баг в ядре

насколько я понимаю, проверку можно спокойно прервать и загрузить другую ОСь для сравнения

router ★★★★★ ()
Ответ на: комментарий от router

1. %util в районе 11 на 2+ хопах после запуска, диски сейчас интенсивно не юзаются и я даже гасил часть не очень нужных виртуалок.

iotop тоже не показывает никакой загрузки толком, первые строчки [jbd2/dm-14-8].

2. Лимиты пробовал поднимать, сейчас минимальный 1000, максимальный 500000. Но независимо от лимитов, чек бы хоть как-то двигался.

3. Вот хз чего думать, ребут ща не вариант на этой машине совсем =/ Видимо буду планировать большую миграцию и потом заниматься дисками.

При этом md0 (собран из других партиций тех же дисков) чекается нормально абсолютно (он небольшой), а при проблемах с дисками обычно в дмезг валятся сообщения ata error.

BaBL ★★★★★ ()
Ответ на: комментарий от turtle_bazon

Скорость маленькая. Или один из дисков подыхает, или IO нагрузка текущая мешает.

Ты не понял. Скорость не маленькая, она 0. Цифры блоков не меняются сколько бы он ни висел. Просто такова специфика отображения, как у винды «Осталось 10 минут.... 30 минут.... 1 час... 24 дня...»

Т.е. он просто на этом массиве на каком-то этапе «заткнулся» и не движется, соседний md проходит корректно и быстро, лагов в системе нет (если бы диск был мертв - там бы рейд тормозил как не в себя и у меня вешались бы все виртуалки от io).

А нет какого-то способом «дропнуть» текущий прогресс и начать чек с самого начала? Если его перевести в idle и вернуть - он продолжает с того же места.

BaBL ★★★★★ ()
Последнее исправление: BaBL (всего исправлений: 1)