XG был заменён, и теперь установлен второй 8-портовый агрегирующий коммутатор, при этом резервные каналы переключены с 1G на 10G для поддержания производительности. Всё теперь идеально: ни одного критического состояния порта не обнаруживается при нормальной работе, а при сбое любого коммутатора результат – «Ну и что», хотя сигнализирует куча тревог мониторинга. Меняем и продолжаем работать как обычно.
Мне не нравится, что этот XG начал сам по себе так капризничать, некоторые теоретики заговоров, возможно, уже называют это встроенным устареванием, но теперь я уверен, что кластер серверов будет работать, как и ожидалось, независимо от того, что случится с сетью. Кидай деньги на «проблему» — и она решится.
Чтобы не уходить в сторону, единственное, что меня теперь раздражает при настройке резервных сетевых каналов, — это то, что когда RSTP блокирует избыточные порты, это отображается как «критическое» состояние... То есть ситуация, когда с «странного» превращается в «обычное», вдруг становится «критичной». Это специально сделанная избыточность, зачем же тогда её считать «критичной»? Я так и задумал, так что просто тишина — перестаньте меня донимать случайными тревогами и интерфейсом, переполненным красным цветом = плохо. Дайте простой способ обозначать: «Этот порт выполняет роль резервного», и пусть мониторинг и логи ведут себя соответствующим образом. Например, галочка «не сообщать» или, если сообщать, то на уровне INFO. Вот для этого и родился протокол Rapid Spanning Tree — быстро менять предпочтительные пути трафика при изменениях топологии, то есть при сбоях. Кольцевые топологии существуют благодаря RSTP, и теперь у меня есть 10G-кольцо после переделки, вызванной тем, что проблемный XG вышел из строя и был заменён не на один, а на два коммутатора.
Никакие изменения приоритетов RSTP на коммутаторах в моей сети этого не исправили, но теоретически я могу что-то упустить. Хотя, скорее всего, нет, ведь у каждого коммутатора свой приоритет: 0 — ядро, подключённое к Интернету; 4096 — второе ядро; 8192 — третье ядро, вот и кольцо. Все конечные узлы настроены на возрастающие и разные приоритеты.