Каталог Поиск 0 Сравнить 0 Закладки 0 Корзина Войти
Каталог
105082, Москва, ул. Фридриха Энгельса, 75с21, БЦ Бауманский ИТКОЛ
Пн - Пт: с 09-00 до 18-00 Сб: с 10-00 до 18-00 Вс: выходной
Страницы: 1
RSS
Unifi XG и сетевые карты Intel X710-T4L — случайные разрывы соединения?, wifiman
 
Привет всем! У меня тут какая-то странная проблема, я как будто залез в кроличью нору, и надеюсь, что кто-нибудь из вас сталкивался с чем-то подобным. У нас есть кластер Windows Server 2022 из двух узлов, и мы заметили случайные разрывы соединения (2-6 секунд) на некоторых сетевых портах. На каждом узле есть сетевая карта Intel X710-T4L и 2 порта от каждого узла подключены к 2 разным коммутаторам Unifi XG 24 port, сейчас работающим на версии прошивки 6.6.53. Порты подключены к Hyper-V коммутатору SET (Switch Embedded Teaming), что делает его независимым от коммутатора, и он использует алгоритм балансировки нагрузки HyperVPort. Мы используем эту конфигурацию уже несколько месяцев, проводим какие-то тесты, но эти разрывы были с самого начала, так что это не из-за какого-то обновления. Но разрывы настолько случайны и очень короткие (без уведомлений о событиях кластера), что их было сложно заметить. И благодаря нашей резервной конфигурации коммутаторов, все продолжало работать нормально в течение этих коротких периодов. Эти разрывы могут происходить раз в день, раз в неделю, два раза в день — совершенно случайно. У меня ощущение, что это связано с повышенной нагрузкой на сеть, но пока не могу это доказать. После более тщательного изучения мы обнаружили, что несколько наших некритических серверов, также использующих NIC X710-T4L, испытывают эту проблему. Один из этих серверов подключен к коммутатору Dell и коммутатору Unifi XG 24 port, и разрывы происходят только на портах, подключенных к XG. Другой некритичный сервер подключен к порту коммутатора USW-Enterprise-48 (версия прошивки 6.6.53), поэтому мы знаем, что это не только проблема модели XG. Поговорил со службой поддержки Ubiquiti, и они заметили некоторые события STP в журналах. Пример ниже:

Feb 25 11:16:36 USW-EnterpriseXG-24-6.6.53+15174: switch: TRAPMGR: Link Down: 0/2
Feb 25 11:16:36 USW-EnterpriseXG-24-6.6.53+15174: switch: DOT1S: Port (2) inst(0) role changing from ROLE_DESIGNATED to ROLE_DISABLED
Feb 25 11:16:40 USW-EnterpriseXG-24-6.6.53+15174: mcad: mcad[2012]: ace_reporter.reporter_json(): immediately send user inform packet
Feb 25 11:16:42 USW-EnterpriseXG-24-6.6.53+15174: switch: TRAPMGR: Link Up: 0/2
Feb 25 11:16:42 USW-EnterpriseXG-24-6.6.53+15174: switch: DOT1S: Port (2) inst(0) role changing from ROLE_DISABLED to ROLE_DESIGNATED

Я уже поговорил с поддержкой Dell (так как это PowerEdge Servers), и они хотят, чтобы я заменил кабели, хотя я сильно сомневаюсь, что это проблема. Драйверы и прошивка обновлены до последних версий от Dell. Поговорил с Intel, но они меня проигнорировали, сказав вернуться к Dell, так как у Dell есть свои драйверы и прошивка, которые работают с их NIC и прошли их тестирование.

Я много чего изучил про NIC X710, и частой темой является отключение LLDP на NIC и порту. У меня запланировано окно обслуживания, чтобы попробовать это на этой неделе, и я сообщу, сработало ли это или нет.

Но я хотел обратиться к этому сообществу и узнать, сталкивался ли кто-нибудь с подобным опытом с этой NIC и коммутаторами Ubiquiti? Я не могу быть единственным с этой проблемой. Или если у вас есть NIC XL710, подключенная к коммутатору Ubiquiti, не могли бы вы проверить свои журналы и посмотреть, были ли у вас какие-то короткие разрывы соединения?

Заранее спасибо за любые отзывы или предложения.
 
Привет всем! Хотел сообщить, что мы нашли решение этой проблемы. Я выполнил все эти шаги, и случайные разрывы соединения прекратились:

*   Отключил LLDP агент в прошивке Dell LifeCycle Controller для каждого порта.
*   Отключил протокол LLDP на каждом порту, подключенном к серверам, на UnifiXG24.
*   Отключил протокол LLDP в панели управления Windows для каждой сетевой карты.

После этого всё работает стабильно уже более двух недель. Надеюсь, это поможет кому-нибудь еще. У меня такое чувство, что достаточно выполнить только пункт #1, так как Dell очень плохо документирует эту функцию (даже инженер, с которым я работал, об этом не знал), и я нашел это только в случайном видео на YouTube. Я бы дал ссылку на видео, но это не разрешено.

Хорошего дня!
Страницы: 1
Читают тему (гостей: 1)