Каталог Поиск 0 Сравнить 0 Закладки 0 Корзина Войти
Каталог
105082, Москва, ул. Фридриха Энгельса, 75с21, БЦ Бауманский ИТКОЛ
Пн - Пт: с 09-00 до 18-00 Сб: с 10-00 до 18-00 Вс: выходной
Страницы: 1
RSS
Несколько точек доступа перезагружаются случайным образом., UniFi Network
 
Привет!  
Я уже писал об этом на форуме EdgeSwitch, потому что, возможно, проблема в самом коммутаторе, но решил запостить и сюда — вдруг кто-то подскажет, на что обратить внимание, чтобы найти причину проблемы.  
У меня несколько (19) UniFi AP, в основном AC-Pro, которые, кажется, перезагружаются случайным образом — контроллер сообщает о перезагрузках. Все точки доступа подключены к EdgeSwitch (но не все к одному и тому же коммутатору). Единственное, что мне удалось заметить — по крайней мере на одном из коммутаторов в логе появляется такое сообщение в тот момент, когда контроллер фиксирует перезагрузку AP:  
Info DOT1S Port (31) inst(0) role changing from ROLE_DISABLED to ROLE_DESIGNATED  
11:23:55 Notice TRAPMGR Link Down: 0/31  
11:23:55 Info DOT1S Port (31) inst(0) role changing from ROLE_DESIGNATED to ROLE_DISABLED  

Пока не удалось понять, появляется ли это сообщение постоянно при каждой перезагрузке AP — к сожалению, с тех пор, как я начал заниматься этой проблемой, перезагрузилась лишь одна точка, и в логе коммутатора соответствующего сообщения не было.  

Есть ли что-то, что можно проверить или сделать на стороне AP для диагностики? Мне кажется, что эта проблема появилась недавно и, возможно, совпала с обновлением прошивки... хотя могу и ошибаться.  

Буду благодарен за любую помощь!
 
@UBNT-BenBuckley

- Увидел, что вышла версия 5.9.29, обновился до неё. Включил netconsole на контроллере. Забавно, проверил пару точек доступа — теперь они нормально разрешают syslog.ubnt-ut.com.
 
@rocketboy001

Какой модель AP, которая зависает при setup-netconsole и nslookup?

Если 4.0.0 работает, смело ставь эту версию прошивки и включай netconsole, чтобы я мог получить логи сбоев.
 
@UBNT-BenBuckley

Если посмотреть в фрагмент лога, то увидишь, как дата меняется с 3 октября на 14 сентября — вот именно в этот момент и происходит проблема. Был ли это нормальный перезапуск или какой-то другой сбой — не уверен. Использование памяти на AP стабильно держится в районе 50-55%.
 
@UBNT-BenBuckley

- Ну, выдает ту же ошибку, но, кажется, она решается:
ap-016116-BZ.v4.0.1# nslookup syslog.ubnt-ut.com  
nslookup: can't resolve '(null)': Name does not resolve

Name:      syslog.ubnt-ut.com  
Address 1: 192.76.255.30  
ap-016116-BZ.v4.0.1#

Обратите внимание, что я запускал setup-netconsole на AP, который еще не был на 4.0, и ошибки не было. Обновил AP до 4.0 — и появилась ошибка.
 
@rocketboy001

Это может произойти, если syslog.ubnt-ut.com не удаётся разрешить.

Попробуй выполнить команду nslookup syslog.ubnt-ut.com с точки доступа и посмотри, что получится.
 
@UBNT-BenBuckley

Я включил netconsole только на нескольких точках доступа. Сейчас включил его на всех. Но при запуске setup-netconsole получаю следующее: Думаю, это связано с изменениями в прошивке 4.0. Кстати, у нас контроллер версии 5.8.30. Могу обновиться до 5.9, если считаешь, что это нужно.
 
@j45p3r

Я беру назад своё последнее замечание. Я обсудил это с коллегой, и у нас есть нечто, что МОЖЕТ быть причиной проблемы. Хотели бы попробовать отладочную прошивку?
 
@j45p3r

Да, можешь включить netconsole и заново активировать minRSSI, чтобы посмотреть, не выпадет ли что-то интересное при сбое? Нам нужно понять, почему эта функция вызывает крах.
 
@UBNT-BenBuckley

Мы отключили minRSSI, и перезагрузки прекратились. Ты все еще хочешь настроить Netconsole?
 
@rocketboy001

@j45p3r

Я тут только что понял, что в контроллере версии 5.9.x (если вы используете именно эту версию) есть возможность проще настроить netconsole. Если настроить сайт именно так, мы будем получать логи со всех AP на объекте. Если же нужны логи только с конкретных AP, придется запускать вручную через ssh, как писали раньше.
 
@rocketboy001

Я знаю, что у нас на сервере есть некоторые логи от тебя. Ты использовал setup-netconsole или просто указал наш syslog-сервер через интерфейс?
 
@j45p3r

Похоже, что syslog пропустил сбой (я такое видел не один раз). Запусти, пожалуйста, setup-netconsole через ssh на AP и скажи мне свой публичный IP-адрес на том сайте, где происходят перезагрузки.

Это будет отправлять логи на syslog-сервер в нашем офисе и обычно фиксирует больше событий, чем твой syslog-сервер при сбое. Учти, что после перезагрузки AP netconsole не сохраняется, так что команду придётся запускать заново.
 
@UBNT-APieper

Несколько перезагрузок на прошивке 4.0.1, к вашему сведению.
 
@j45p3r

Можешь прислать мне весь лог-файл? Я тут не вижу перезагрузки. Также проверь, пожалуйста, контроллер на историю использования памяти.

Похоже, у тебя включен minRSSI, и один клиент постоянно вылетает снова и снова. Интересно, не связано ли это как-то. Ты наблюдаешь ту же проблему, если отключить minRSSI?
 
@UBNT-APieper

- Сделаю. Спасибо.
 
@rocketboy001

По некоторым из ваших UAP-AC-PRO, у которых проявляется проблема с перезагрузкой, можете попробовать обновить прошивку до этой версии и проверить, повлияет ли это на поведение при перезагрузке? Это поможет нам немного сузить круг возможных причин. Спасибо, что предоставили нам эти логи. Мы сейчас изучаем некоторые ошибки, которые обнаружили в логах netconsole. Благодарим вас за сотрудничество.
 
@Hurricanes27

Можешь дать мне доступ к серверу syslog, чтобы я мог посмотреть логи? Или, если проще, заархивируй их и пришли мне личным сообщением ссылку.
 
@UBNT-BenBuckley,

Я собрал более 30 000 строк логов с постоянными перезагрузками во время моего мероприятия на прошлой неделе. Сейчас я все еще веду серверы логов на этих двух конкретных площадках. Могу поделиться любыми данными, чтобы разобраться в проблеме. Мы приоритизировали управляющий трафик для устройств UniFi в наших конфигурациях QoS и правилах фаервола.
 
Я только что настроил syslog-сервер. Завтра сообщу о результатах.
Страницы: 1
Читают тему (гостей: 1)