Привет всем! У меня тут какая-то странная проблема, я как будто залез в кроличью нору, и надеюсь, что кто-нибудь из вас сталкивался с чем-то подобным. У нас есть кластер Windows Server 2022 из двух узлов, и мы заметили случайные разрывы соединения (2-6 секунд) на некоторых сетевых портах. На каждом узле есть сетевая карта Intel X710-T4L и 2 порта от каждого узла подключены к 2 разным коммутаторам Unifi XG 24 port, сейчас работающим на версии прошивки 6.6.53. Порты подключены к Hyper-V коммутатору SET (Switch Embedded Teaming), что делает его независимым от коммутатора, и он использует алгоритм балансировки нагрузки HyperVPort. Мы используем эту конфигурацию уже несколько месяцев, проводим какие-то тесты, но эти разрывы были с самого начала, так что это не из-за какого-то обновления. Но разрывы настолько случайны и очень короткие (без уведомлений о событиях кластера), что их было сложно заметить. И благодаря нашей резервной конфигурации коммутаторов, все продолжало работать нормально в течение этих коротких периодов. Эти разрывы могут происходить раз в день, раз в неделю, два раза в день — совершенно случайно. У меня ощущение, что это связано с повышенной нагрузкой на сеть, но пока не могу это доказать. После более тщательного изучения мы обнаружили, что несколько наших некритических серверов, также использующих NIC X710-T4L, испытывают эту проблему. Один из этих серверов подключен к коммутатору Dell и коммутатору Unifi XG 24 port, и разрывы происходят только на портах, подключенных к XG. Другой некритичный сервер подключен к порту коммутатора USW-Enterprise-48 (версия прошивки 6.6.53), поэтому мы знаем, что это не только проблема модели XG. Поговорил со службой поддержки Ubiquiti, и они заметили некоторые события STP в журналах. Пример ниже:
Feb 25 11:16:36 USW-EnterpriseXG-24-6.6.53+15174: switch: TRAPMGR: Link Down: 0/2
Feb 25 11:16:36 USW-EnterpriseXG-24-6.6.53+15174: switch: DOT1S: Port (2) inst(0) role changing from ROLE_DESIGNATED to ROLE_DISABLED
Feb 25 11:16:40 USW-EnterpriseXG-24-6.6.53+15174: mcad: mcad[2012]: ace_reporter.reporter_json(): immediately send user inform packet
Feb 25 11:16:42 USW-EnterpriseXG-24-6.6.53+15174: switch: TRAPMGR: Link Up: 0/2
Feb 25 11:16:42 USW-EnterpriseXG-24-6.6.53+15174: switch: DOT1S: Port (2) inst(0) role changing from ROLE_DISABLED to ROLE_DESIGNATED
Я уже поговорил с поддержкой Dell (так как это PowerEdge Servers), и они хотят, чтобы я заменил кабели, хотя я сильно сомневаюсь, что это проблема. Драйверы и прошивка обновлены до последних версий от Dell. Поговорил с Intel, но они меня проигнорировали, сказав вернуться к Dell, так как у Dell есть свои драйверы и прошивка, которые работают с их NIC и прошли их тестирование.
Я много чего изучил про NIC X710, и частой темой является отключение LLDP на NIC и порту. У меня запланировано окно обслуживания, чтобы попробовать это на этой неделе, и я сообщу, сработало ли это или нет.
Но я хотел обратиться к этому сообществу и узнать, сталкивался ли кто-нибудь с подобным опытом с этой NIC и коммутаторами Ubiquiti? Я не могу быть единственным с этой проблемой. Или если у вас есть NIC XL710, подключенная к коммутатору Ubiquiti, не могли бы вы проверить свои журналы и посмотреть, были ли у вас какие-то короткие разрывы соединения?
Заранее спасибо за любые отзывы или предложения.
Feb 25 11:16:36 USW-EnterpriseXG-24-6.6.53+15174: switch: TRAPMGR: Link Down: 0/2
Feb 25 11:16:36 USW-EnterpriseXG-24-6.6.53+15174: switch: DOT1S: Port (2) inst(0) role changing from ROLE_DESIGNATED to ROLE_DISABLED
Feb 25 11:16:40 USW-EnterpriseXG-24-6.6.53+15174: mcad: mcad[2012]: ace_reporter.reporter_json(): immediately send user inform packet
Feb 25 11:16:42 USW-EnterpriseXG-24-6.6.53+15174: switch: TRAPMGR: Link Up: 0/2
Feb 25 11:16:42 USW-EnterpriseXG-24-6.6.53+15174: switch: DOT1S: Port (2) inst(0) role changing from ROLE_DISABLED to ROLE_DESIGNATED
Я уже поговорил с поддержкой Dell (так как это PowerEdge Servers), и они хотят, чтобы я заменил кабели, хотя я сильно сомневаюсь, что это проблема. Драйверы и прошивка обновлены до последних версий от Dell. Поговорил с Intel, но они меня проигнорировали, сказав вернуться к Dell, так как у Dell есть свои драйверы и прошивка, которые работают с их NIC и прошли их тестирование.
Я много чего изучил про NIC X710, и частой темой является отключение LLDP на NIC и порту. У меня запланировано окно обслуживания, чтобы попробовать это на этой неделе, и я сообщу, сработало ли это или нет.
Но я хотел обратиться к этому сообществу и узнать, сталкивался ли кто-нибудь с подобным опытом с этой NIC и коммутаторами Ubiquiti? Я не могу быть единственным с этой проблемой. Или если у вас есть NIC XL710, подключенная к коммутатору Ubiquiti, не могли бы вы проверить свои журналы и посмотреть, были ли у вас какие-то короткие разрывы соединения?
Заранее спасибо за любые отзывы или предложения.
