LINUX.ORG.RU
ФорумAdmin

Глючит сеть компании.

 


1

8

Одноранговая сеть. Построена на звёздах. Один центральный цисковский свитч, гигабитный. От него сколько свитчей помельче. ДО этих выходных сеть работала каменно и стабильно. Но тут начинается внезапная Джигурда, а именно: 2 машины, воткнутые в один свитч, отказываются пинговаться, при этом обе пингуют шлюз, а со шлюза пингуются обе. Проблема решается перезапуском свитча. Проблема возникает хаотично, отрубая или целые сегменты сети, или пару машин. На разных этажах, с разными машинами и свитчами. Что за фигня? о_О Куда копать?

Может быть так, что кто-то как-то меняет ARP таблицы свитчей? Такие вирусы есть?

Не уверен, но там, где я работал, практически с теми же симптомами ложилась сеть. Всё аналогично твоей, построена на цисках. Периодически намертво ложились сегменты на срок от пяти минут до пары часов. Ребята, которые занимались этой проблемой, перебрали всю сеть и нашли петлю на кроссе - результат небрежного оформления эксплуатационной документации. «Умное» оборудование как-то ситуацию разруливало, поэтому всё худо-бедно работало. Будь там что попроще, подубовей - сеть легла бы сразу, но зато проблему нашли бы раньше. К сожалению, подробностей подсказать не могу, т.к. сам лично этим не занимался.

agentgoblin
()
Ответ на: комментарий от agentgoblin

Петлей нет, я по свитчу сразу определяю петлю.. оно ж моргает синхронно как психованное) А тут такого нет... моргает конечно, иногда даже синхронно, но это всё в пределах нормы.

k4m454k
() автор топика
Ответ на: комментарий от k4m454k

У меня НЕ управляемый цисковский свитч)

Таких НЕ бывает. Назовите модель.

alexnorton
()
Ответ на: комментарий от k4m454k

Всё, я увидел, что свичи неуправляемые. У нас-то были всякие, плюс на каждой точке (различные здания, везде своя аппаратная) по роутеру стояло.

Конфликты IP-адресов исключены? У вас там статика или DHCP имеется?

agentgoblin
()
Ответ на: комментарий от agentgoblin

Статика. вторая подсеть раздаётся по DHCP. Но она гостевая.

Конфликты исключены, иначе бы что-то ругалось)

k4m454k
() автор топика

Вот сейчас пинги идут до одного из сегментов.

PING 192.168.0.192 (192.168.0.192) 56(84) bytes of data.
From 192.168.0.1 icmp_seq=1 Destination Host Unreachable
From 192.168.0.1 icmp_seq=2 Destination Host Unreachable
From 192.168.0.1 icmp_seq=3 Destination Host Unreachable
From 192.168.0.1 icmp_seq=5 Destination Host Unreachable
From 192.168.0.1 icmp_seq=6 Destination Host Unreachable
From 192.168.0.1 icmp_seq=7 Destination Host Unreachable
64 bytes from 192.168.0.192: icmp_seq=8 ttl=255 time=10800 ms
64 bytes from 192.168.0.192: icmp_seq=9 ttl=255 time=9800 ms
64 bytes from 192.168.0.192: icmp_seq=10 ttl=255 time=8781 ms
64 bytes from 192.168.0.192: icmp_seq=16 ttl=255 time=5740 ms
64 bytes from 192.168.0.192: icmp_seq=19 ttl=255 time=4234 ms
64 bytes from 192.168.0.192: icmp_seq=21 ttl=255 time=3733 ms
64 bytes from 192.168.0.192: icmp_seq=22 ttl=255 time=10223 ms

k4m454k
() автор топика
Ответ на: комментарий от anonymous

Вряд-ли провод. Хотя один глючный нашли. Заменили.. но тем не менее.. Сейчас забавные факты открылись) Отрубил все свичи, оставил только работающие сервера + свитч (2й этаж) и свитч первого этажа, свой ноут воткнул снизу… Пингую сервера, оч тугие пинги. Перетянули провод… пинги идеальны.. но иногда волнообразно идут задержки… сначала на 90мс, потом на 500. потом на 2-3 тысячи. и так же на спад… буквально на 5-6 секунд. И снова пинги менее 1 мс.

Потом начал втыкать свитчи по одному, и на каждом новом свитче сеть подвисала на некоторое время… пинги росли ужасно.

Вот пример скачка.

64 bytes from 192.168.0.7: icmp_seq=9466 ttl=128 time=0.386 ms
64 bytes from 192.168.0.7: icmp_seq=9467 ttl=128 time=0.392 ms
64 bytes from 192.168.0.7: icmp_seq=9468 ttl=128 time=782.557 ms
64 bytes from 192.168.0.7: icmp_seq=9469 ttl=128 time=1281.418 ms
64 bytes from 192.168.0.7: icmp_seq=9470 ttl=128 time=280.354 ms
64 bytes from 192.168.0.7: icmp_seq=9471 ttl=128 time=3778.988 ms
64 bytes from 192.168.0.7: icmp_seq=9472 ttl=128 time=4277.903 ms
64 bytes from 192.168.0.7: icmp_seq=9473 ttl=128 time=4776.753 ms
64 bytes from 192.168.0.7: icmp_seq=9474 ttl=128 time=3775.760 ms
64 bytes from 192.168.0.7: icmp_seq=9475 ttl=128 time=2775.522 ms
64 bytes from 192.168.0.7: icmp_seq=9476 ttl=128 time=3274.314 ms
64 bytes from 192.168.0.7: icmp_seq=9477 ttl=128 time=2273.331 ms
64 bytes from 192.168.0.7: icmp_seq=9478 ttl=128 time=2772.762 ms
64 bytes from 192.168.0.7: icmp_seq=9479 ttl=128 time=1771.690 ms
64 bytes from 192.168.0.7: icmp_seq=9480 ttl=128 time=770.687 ms
64 bytes from 192.168.0.7: icmp_seq=9481 ttl=128 time=1269.521 ms
64 bytes from 192.168.0.7: icmp_seq=9482 ttl=128 time=268.613 ms
64 bytes from 192.168.0.7: icmp_seq=9483 ttl=128 time=0.351 ms
64 bytes from 192.168.0.7: icmp_seq=9484 ttl=128 time=0.297 ms

и снова всё ок на пол минуты… или больше

k4m454k
() автор топика
Ответ на: комментарий от k4m454k

А, забыл нужную вещь сказать… сейчас сижу пингую много разных ip одновременно. На разных этажах, в этом свитче и в соседних. И скачки одновременно начинают тормозить все пинги… в одну секунду начинается и прекращается. Я думал, что бродкасты… iptraf запустил, там оно умеет считать количество бродкастов.. Ну их нет почти.. так, 15-40 за минуту..ну это фигня для гигабитной сети

k4m454k
() автор топика

Камасаааак! Какие люди!
А свич не делл случаем? :)
Сколько лет свичу? Он на гарантийке?

tazhate ★★★★★
()
Ответ на: комментарий от tazhate

Его меняли.. и отрубали… и сервера по одному вытаскивали… Второй день офис стоит

k4m454k
() автор топика
Ответ на: комментарий от alexnorton

согласен! позвони мне. +7(916)5СемьСемь-3о-о3

k4m454k
() автор топика
Ответ на: комментарий от k4m454k

Приезжай ко мне)) а я тя пивом напою) А ты мне поможешь))

Пропустил момент как-то :)
Еще надо ехать или комментатор выше приехал?

tazhate ★★★★★
()
Ответ на: комментарий от tazhate

надо, но завтра уже)) сегодня я свалил))

k4m454k
() автор топика

Вот оно, поколение пепси во главе с Белым Принцем на Белом Плюсомете.

Ларчик просто открывался. Вас не удивило, что глючит ВСЯ сеть, а не только какая-то отдельная её часть?

Варианты правильного ответа очень просты:

1. «Промышленное электричество» в здании. То есть, «скачущее» по частоте/напряжению. Одновременно во всём здании. Вот и глючит у вас всё.

2. Где-то в непосредственной близости от здания - мощный источник электромагнитного излучения. Соответственно, глючит сразу вся сеть (она ж у вас одна большая антенна).

Рекомендации: всё оборудование повесить на UPSы; всю витуху (в том числе пачкорды непосредственно к компам) заменить на экранированную, экранирующую оплетку заземлить; свичи с пластмассовым корпусом (буде таковые есть) заменить на свичи с металлическим корпусом, тоже заземлить всё.

tazhater
()
Ответ на: комментарий от tazhater

Как вариант, но для такой масштабной перестройки надо быть точно уверенным в этом. Провести измерения.

petav ★★★★★
()

Может быть так, что кто-то как-то меняет ARP таблицы свитчей?

Свитчи, тем более неуправляемы работают на L2 и у них нет ARP таблицы, только CAM.

Ставлю на поехавший свитч.

Отрубил все свичи, оставил только работающие сервера + свитч (2й этаж) и свитч первого этажа, свой ноут воткнул снизу…

Вот тут в схеме есть два свитча и периодически наблюдается проблема - я бы тут поискал проблемный свитч, подключив все вначале в один, потом в другой.

На самом деле я бы собрал свитчи в одном месте, попытался бы воспроизвести проблему и tcpdump'я с обоих сторон - только так можно хоть что-то посмотреть. Хотя бы на предмет где гуляют пакеты по несколько секунд и в каких буферах оседают.

xscrew ★★
()
Последнее исправление: xscrew (всего исправлений: 2)
Ответ на: комментарий от k4m454k

Две машины на обоих запущен tcpdump - пустить пинги на одной машине, смотреть как пришли эхо реквесты на другую - сразу, или с задержкой. Как пошли эхо реплаи - сразу или с задержкой. Ну как-то так, чтобы понять где задерживается, в какую сторону задерживается. И еще - петли точно нет? Даже если петли физической нет, бывают проблемы на коммутаторах, что он начинает множить пакеты - в таком случае в том же tcpdump можно будет видеть свои же широковещательные пакеты.

xscrew ★★
()
Ответ на: комментарий от xscrew

Я пытался отключать отделы по одному. Думаю, если бы вырубил коммутатор глючащий, всё бы восстановилось постепенно. Но нет, всё продолжало глючить

k4m454k
() автор топика

нафига в ядро ставить неуправляемый коммутатор?

варианта два:

1. у тебя петля

2. на одном из устройств глючит сетевая/порт

Turbid ★★★★★
()
Последнее исправление: Turbid (всего исправлений: 2)
Ответ на: комментарий от k4m454k

Я пытался отключать отделы по одному.

всё продолжало глючить

Проблема в оставшемся коммутаторе.

xscrew ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.