LINUX.ORG.RU

Проблемы с СХДхой: qla2xxx: abort command issue

 , ,


0

1

В общем, такая штука: в шасси hp c7000 стоит bl460c g6, фибра ae372a, подключена полка hp p2000 msa g3, в ней ap837b.

Создал vdisk с пятым рейдом из восьми винтов, настроил lun, замапил. Работает, норм: файловая система создается, монтируется.

Делаю еще один такой же, делаю лун, маппинг. Инициализация прошла.

#multipath -ll
3600c0ff000199b069319335601000000 dm-1 HP,P2000G3 FC/iSCSI
size=956G features='1 queue_if_no_path' hwhandler='0' wp=rw
|-+- policy='service-time 0' prio=50 status=active
| |- 0:0:0:8 sdc 8:32  active ready running
| `- 2:0:0:8 sdg 8:96  active ready running
`-+- policy='service-time 0' prio=10 status=enabled
  |- 0:0:1:8 sde 8:64  active ready running
  `- 2:0:1:8 sdi 8:128 active ready running
3600c0ff000197293f0ab285601000000 dm-0 HP,P2000G3 FC/iSCSI
size=956G features='1 queue_if_no_path' hwhandler='0' wp=rw
|-+- policy='service-time 0' prio=50 status=active
| |- 0:0:1:7 sdd 8:48  active ready running
| `- 2:0:1:7 sdh 8:112 active ready running
`-+- policy='service-time 0' prio=10 status=enabled
  |- 0:0:0:7 sdb 8:16  active ready running
  `- 2:0:0:7 sdf 8:80  active ready running


Пытаюсь создавать фс или потыкать cfdisk'ом, получаю вот такую шнягу:

[ 1321.877217]  [<ffffffff8113c950>] ? filemap_fdatawait_range+0xd0/0x160
[ 1321.880720]  [<ffffffff811d52a0>] ? sync_inodes_one_sb+0x20/0x20
[ 1321.884139]  [<ffffffff811:dd3a6>] ? iterate_bdevs+0xc6/0x100
[ 1321.887363]  [<ffffffff811d552e>] ? sys_sync+0x6e/0x90
[ 1321.890572]  [<ffffffff8151158d>] ? system_call_fast_compare_end+0x10/0x15
[ 1330.025499] qla2xxx [0000:06:00.0]-801c:0: Abort command issued nexus=0:0:8 --  1 2002.
[ 1330.028877] qla2xxx [0000:06:00.0]-801c:0: Abort command issued nexus=0:1:8 --  1 2002.
[ 1330.057620] qla2xxx [0000:06:00.1]-801c:2: Abort command issued nexus=2:1:8 --  1 2002.
[ 1362.055468] qla2xxx [0000:06:00.1]-801c:2: Abort command issued nexus=2:1:8 --  1 2002.
[ 1362.055556] qla2xxx [0000:06:00.0]-801c:0: Abort command issued nexus=0:1:8 --  1 2002.


http://dump.bitcheese.net/files/acifitu/2015-10-30-120759_1680x1050_scrot.png

Причем, оперировать с этим луном не может не только этот дебиан, но и ESXi при попытке создать сторадж выплевывает вот это:

http://dump.bitcheese.net/files/uwixyhe/2015-10-30-123958_1680x1050_scrot.png

Может, есть у кого-нибудь мысли, кто виноват и что с этим всем делать?

★★

Последнее исправление: warl0ck (всего исправлений: 3)

Ответ на: комментарий от warl0ck

Ну, попробуй у «неработающего» LUN'а поставить владельцем тот же контроллер, что и у «работающего» LUN'а.
По тому обрывку логов, что ты привел, видно, что фэйлятся оба пути в активной path-группе. А дальше что происходит? Переключение на другую path-группу происходит?
И multipath.conf покажи.

bigbit ★★★★★
()
Последнее исправление: bigbit (всего исправлений: 1)
Ответ на: комментарий от bigbit

Спасибо, попробую в понедельник. Ну и до логов доберусь, соответственно, тоже.

Как помню, обрыв происходит и при попытке обратиться к каналу напрямую через /dev/sd[a-z] с отключенным multipath'ом.

Соответственно, с рабочим луном такие операции проходят без ошибок.

Вообще, действительно грешу на контроллер: было такое уже, исчезло с заменой железки. Но каково паскудство: статусы кругом OK, мол все хорошо, прекрасная маркиза.

warl0ck ★★
() автор топика
Последнее исправление: warl0ck (всего исправлений: 2)
Ответ на: комментарий от bigbit

В общем, перекинул на контроллер «A», заработало. Только не понятно, в чем проблема с вторым...

warl0ck ★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.