Каталог Поиск 0 Сравнить 0 Закладки 0 Корзина Войти
Каталог
105082, Москва, ул. Фридриха Энгельса, 75с21, БЦ Бауманский ИТКОЛ
Пн - Пт: с 09-00 до 18-00 Сб: с 10-00 до 18-00 Вс: выходной
Страницы: 1
RSS
Утечка памяти с UAP-Pro + прошивкой 3.7.8.5016, UniFi Network
 
@UBNT-Brandon

Недавно я откатил прошивку на нескольких UAP-Pro (Gen 1) с версии 3.7.17.5220 до 3.7.8.5016 (апгрейдил до 3.7.17.5220, чтобы исправить утечку памяти...). Проблема в том, что в 3.7.8.5016 тоже есть утечка памяти. Этот график за последнюю неделю: «Всплеск» между 29 и 30 сентября — это как раз время отката прошивки. Точка доступа работает с тремя SSID: один хотспот и два WPA2-enterprise. Нет ни band steering, ни мониторинга подключения. Включена UAPSD.
 
Окей. Спасибо, что предупредил, @nduehr.
 
Еще раз спасибо за помощь, но с новым контроллером у нас явно была нестабильность, и, как я понял, это версия 3.7.x. Сегодня мы откатили один AP обратно на 3.2, и будем наблюдать... Когда вышел новый контроллер, у нас была очень старая версия, и мы решили перейти на новый контроллер (особой пользы это не принесло) и разрешили ему сделать автообновление (сначала... потом отключили). Прошивка, которая шла в комплекте с новым контроллером, оказалась нестабильной на трех AP-Pro, работающих с тремя VLAN, подключенных к Active Directory для аутентификации пользователей, в полностью смешанной среде устройств и с максимальной нагрузкой чуть меньше 100 пользователей.

Мне пришлось копаться в старых письмах. Заказ был сделан в мае 2015 года для этого места, и какая прошивка была примерно к концу того месяца — на ней они и работали. Мы повесили их на потолочные лотки, сделали одно обновление и потом оставили в покое до выхода нового контроллера. Сначала думал, что прошло «два года», но на самом деле последняя стабильная версия, которую мы использовали, была около полутора лет назад.

В итоге, если 3.2 окажется стабильной, останемся на ней, пока не утихнут все слухи о нестабильности и утечках памяти. Видеть, как люди настраивают SNMP и строят графики, заставило меня понять, что надо было тоже так делать, хотя использование памяти никогда не приходило в голову как что-то, что нужно мониторить в таких «устройствах».

Они были настолько надежными так долго. Весь этот «процесс» стал для меня неприятным сюрпризом... знаю, такое бывает в IT, но AP-Pro — последнее место, где я рассчитывал проводить время на этой неделе.
 
@nduehr

Хорошее замечание. Мы действительно сохраняем старые версии прошивки на нашем сайте, чтобы люди могли откатиться назад.

Например, похоже, что версия 3.7.5 не имеет этой проблемы.

Вы можете найти её здесь, а затем использовать функцию custom upgrade в интерфейсе для обновления до неё:

http://community.ubnt.com/t5/UniFi-Updates-Blog/UniFi-5-0-7-is-released/ba-p/1587040

Конечно, нам нужно исправить текущий участок кода, потому что он включает массу других исправлений, которые помогли на многих других сайтах.

Удачи,  
Брэндон
 
Я был в службах поддержки, которые сталкивались с такими серьёзными ошибками... Рано или поздно кто-то, кому важнее клиент, чем так называемое «грандиозное обновление», должен сказать всей команде: хватит усугублять ситуацию плохим кодом, пора откатиться назад — вот инструкции. Мы сейчас сидим и думаем, как сделать это вне рабочего времени. Старый вариант хотя бы был стабильным, пусть и с парой недостатков. Может быть, даже сделаем откат по одной точке доступа в рабочее время... Просто нельзя вечно повторять «Мы разберёмся, попробуем другую версию...» Я знаю, как это — быть в службе поддержки и принимать такие звонки. В конечном итоге кто-то должен подойти к разработчикам и сказать: «Ваши шансы исчерпаны, мы просим клиентов вернуться к тому, что работает... Не спешите, сделайте следующее обновление нормально».
 
Ты не один. У меня такая же проблема. Очень-очень раздражает.
 
Не уверен, что мы будем комфортно себя чувствовать на бете, но я, наверное, спрошу у группы. Есть какая-то информация, какие именно “крайние случаи” вызывают проблемы в версии 3.7.21? Я начал рассматривать обновление до 3.7.21, когда увидел, что там исправили “утечки памяти”, а это, похоже, наша основная проблема.

Общий сценарий использования у нас такой: три точки доступа, все AP-Pro, три VLAN, одно здание, один контроллер, точки доступа аутентифицируются через Active Directory для корпоративной среды, клиенты разные – практически всё: Windows-ноутбуки, Mac-ноутбуки и все возможные мобильные устройства, просто не в большом количестве. Обычно около 60 активных устройств в пиковое время дня и 5 устройств после работы.

Что мы заметили – после обновления до последнего крупного релиза контроллера примерно раз в неделю все три AP-Pro перезагружаются сами по себе. Иногда они восстанавливаются, иногда – вообще не включаются, просто зависают, и нам приходится заходить в PoE-коммутатор и отключать питание, чтобы заставить их перезагрузиться. Если мы не заметим, что две из них “зависли”, а третья начнёт вести себя хаотично, конечно же – сервиса нет, даже если третья потом возвращается к работе. Это случилось на неделе после крупного обновления, с тех пор мы вручную проверяем их раз в несколько дней. (SNMP-мониторинг ещё не внедрили, они были стабильны пару лет до этого релиза.)

Если наш сценарий использования похож на ваш и проблемы продолжатся, наверное, лучше подождать стабильную версию. Эти перезагрузки и сбои были очень разочаровывающими после нескольких лет безаварийной работы и гордости, что мы сэкономили по сравнению с более раскрученными брендами… не то чтобы у тех не бывает проблем, но у нас был весомый аргумент благодаря стабильности.

Вся эта “репутация” в пользу выбора их пропала вместе с этим масштабным обновлением. Не думаю, что новый контроллер нам должен был много дать… заметки к релизу подвели нас, заставив думать, что там что-то полезное. Без роутеров Ubiquiti главный “дашборд” выглядит глупо – “3 устройства”, а остальная страница практически пустая и бесполезная.

Меня также не радует странность в том, как контроллер решает, что делать с загрузкой новых версий, и тот факт, что нам пришлось самому указывать AP ссылку, откуда качать обновление… это всё должно проходить через контроллер, а точкам доступа не нужно лезть в интернет с внутреннего VLAN ради прошивки… Нет смысла постоянно держать контроллер, который на самом деле это не контролирует.

Извиняюсь, немного выпустил пар… это “обновление” действительно испортило то, что раньше было отлично. Спасибо за предложение по бете, но лучше нет. По ощущениям мы уже сидим на каком-то бета-коде, как бы его ни называли.
 
@nduehr

Версия 3.7.21 должна решить большинство проблем. Есть ещё одна утечка (и пару редких ошибок), которые исправлены в версии 3.7.24.

Если хотите попробовать 3.7.21 — можете скачать прошивку с нашего сайта ubnt.com.

Если же хотите опробовать самую свежую тестовую версию, зарегистрируйтесь в бета-программе (ссылка в моей подписи) и скачайте её здесь:

http://community.ubnt.com/t5/UniFi-Beta-Blog/FIRMWARE-3-7-24-5422-has-been-released/ba-p/1727962

Спасибо,  
Brandon
 
Позвольте вернуться к этому вопросу. Думаю, в последнем стабильном релизе (3.7.21) это уже исправлено, если речь о той проблеме, которая у меня на уме.

Спасибо,  
Брэндон
 
Есть ли новости по исправлению этой утечки памяти?
Страницы: 1
Читают тему (гостей: 1)