LINUX.ORG.RU
ФорумAdmin

ядро 3.0 + чипсет X58 = залипы


0

1

Проявляется, судя по всему, при повышенной загрузке дискового или же сетевого ввода/вывода, точнее пока определить не удалось.
График отражающий iowait в Заббиксе, например, имеет провалы в такие моменты. SSH заметно подтормаживает, пинги увеличиваются на порядок.
С ядром 2.6.32 всё отлично работало.

Сейчас сделал дополнительные тесты. Похоже, тормоза появляются когда идёт одновременнее чтение данных из файла, не обязательно реального, и передача по сети.
при cat /dev/urandom | ssh другой_хост «cat > /dev/null» не проявляется
при cat /some/realfile или /run/shm/realfile или /proc/kcore | ssh другой_хост «cat > /dev/null» проявляется
при чтении/записи/копировании файлов в пределах локальных дисков - не проявляется

★★

Последнее исправление: frozen_twilight (всего исправлений: 5)

Ответ на: комментарий от Slate

да чего вы так к этому 12309 прицепились, будто других проблем в Linux не бывает...
давайте уже по теме топика

frozen_twilight ★★
() автор топика

cat /proc/interrupts

там сетевая карта прерывание не делит, ни с кем?

видимо кто-то надолго отключает прерывания и получается фриз.
смотри изменения в драйвере, ну сетевой например.

dimon555 ★★★★★
()

Перешёл на ядро 2.6.32-5-xen-amd64 #1 SMP Mon Oct 3 07:53:54 UTC 2011 x86_64 GNU/Linux, там очень похожая ситуация, только при работе I/O пинги не возрастают, а попросту начинают теряться пакеты.

149 packets transmitted, 81 received, 45% packet loss, time 148522ms
rtt min/avg/max/mdev = 0.199/4.592/340.203/37.536 ms

Очевидно, проблема где-то на уровне работы с IRQ.

frozen_twilight ★★
() автор топика
Ответ на: комментарий от frozen_twilight

Да, вот ещё наблюдение: ядро 2.6.32-5-xen-amd64 с загруженным гипервизором даёт потери пакетов, то же ядро без гипервизора - увеличенные пинги.
Системы разные, но железо идентичное.

frozen_twilight ★★
() автор топика
Ответ на: комментарий от dimon555

Насколько понимаю, нет.
С гипервизором:

PCI: setting IRQ 10 as level-triggered r8169 0000:06:00.0: found PCI INT A -> IRQ 10

ahci 0000:00:1f.2: found PCI INT B -> IRQ 11

Без гипервизора:

r8169 0000:06:00.0: PCI INT A -> GSI 16 (level, low) -> IRQ 16

ahci 0000:00:1f.2: PCI INT B -> GSI 19 (level, low) -> IRQ 19

frozen_twilight ★★
() автор топика
Ответ на: комментарий от Slate

>А что это за баг? 12309?

Это когда при небольшой нагрузке на дисковую подсистему ядро ложилось отдохнуть на неопределённый период времени. Ну или до следующей перезагрузке. Я думаю поиск в гугле по запросу «12309» немного прояснит ситуацию.

Othniel
()
Ответ на: комментарий от darkshvein

>Нет не тот. Это равномерно, от ядра к ядру усиливается давление зонда Штеуд.

Все говорят о каком-то иллюзорном зонде от штеуда, а об отрицательном пинге у конкурентов умалчивают :D

Othniel
()
Ответ на: комментарий от frozen_twilight

pci=nomsi к параметрам ядра должно помочь. У меня вообще на свежем xen без этого сетевуха не работает.

Ну и irqbalance до кучи, если не поможет.

madgnu ★★★★★
()
Ответ на: комментарий от Othniel

Вау, АМД начала выпускать сетевые карты? Ну, видимо для того, чтобы не пускать в сеть процессоры штеуда. Вот тут то отрицательный пинг и пригодится как никогда. Пойду, затарюсь.

darkshvein ☆☆
()
Ответ на: комментарий от Othniel

В гугле первой вылезает русская статья с лурка, на мунспике мало чего. Явно у америкосов и Ко такой проблемы нет, только у гусских агчеводов))

darkshvein ☆☆
()
Ответ на: комментарий от madgnu

А какое у вас железо? Почитал про MSI, как-то слишком радикально, по-моему.
Я тут нашёл пакет с ядром 2.6.32-5-xen-amd64 #1 SMP Tue Jun 14 12:46:30 UTC 2011 x86_64 GNU/Linux, так вон в нём всё гладко. Видимо, в какой-то момент в обе ветки внесли деградирующие изменения, по крайней мере в отношении какого-то конкретного оборудования.

frozen_twilight ★★
() автор топика
Ответ на: комментарий от Othniel

Всё, понял о чем ты. Сам такое несколько раз ловил на 3.0.2, начиная с 3.0.3 у меня оно пропало, видимо разработчики уже в курсе.

Slate
()
Ответ на: комментарий от Slate

>видимо разработчики уже в курсе.

Разработчики в курсе на протяжении половины выпусков 2.6 :D

Othniel
()
Ответ на: комментарий от madgnu

>Серваки на зеонах. Проблем от отключения MSI в dom0 не заметил.

посмотри на карту прерываний, если два быстрых устройства не делят одно прерывание, то всё более, менее.

dimon555 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.