Каталог Поиск 0 Сравнить 0 Закладки 0 Корзина Войти
Каталог
105082, Москва, ул. Фридриха Энгельса, 75с21, БЦ Бауманский ИТКОЛ
Пн - Пт: с 09-00 до 18-00 Сб: с 10-00 до 18-00 Вс: выходной
Страницы: 1
RSS
Прошивка 3.9.15.8011 — утечки памяти, UniFi Network
 
Всем привет! Обновил несколько UAP Outdoor+ и старых UAP indoor с версии до 3.9.15.8011 (текущая стабильная версия для загрузки). Цель — решить проблему с UAP Outdoor+, которые через примерно 18 дней работы почти полностью забивают память и просто отключаются. Если ловлю их с мегабайтом или двумя свободной памяти (в устройствах 64 МБ ОЗУ), то могу зайти по SSH и перезагрузить их или сделать это через контроллер. Если же ситуация сильно усугубляется, устройства перестают отвечать и приходится физически выключать и включать питание.

Обратил внимание, что в changelog к 3.9.15.8011 написано, что исправили небольшой утечка, но, судя по всему, проблемы с утечками всё еще есть. Сегодня заметил точку доступа без клиентов, у которой после всего лишь 12 дней работы занято 85% памяти — после свежей перезагрузки память снижается до 75%. У других уже по 86% и 87% занято, и, думаю, по мере приближения к 18 дням загрузка памяти будет расти.

Основной виновник — процесс «mcad». На точке доступа, которая работает 12 дней, виртуальный размер этого процесса вдвое больше, чем на только что перезагруженном устройстве. Вот вывод сравнения:

Точка доступа с 12 днями аптайма:  
BZ.v3.9.15# uptime  
17:54:46 up 12 days, 4:13, load average: 0.00, 0.00, 0.00  

BZ.v3.9.15# ps  
...  
1359 admin 13064 S /bin/mcad  
...

Память: всего 62376 КБ, занято 54152 КБ, свободно 8224 КБ.  
Размер процесса /bin/mcad — 13 МБ виртуальной памяти.

Тот же AP после свежей перезагрузки:  
BZ.v3.9.15# uptime  
17:55:32 up 1:40, load average: 0.00, 0.00, 0.00  

BZ.v3.9.15# ps  
...  
1359 admin 7276 S /bin/mcad  
...

Память: всего 62376 КБ, занято 47004 КБ, свободно 15372 КБ.  
/process /bin/mcad — всего 7 МБ. Значит, за 12 дней ушло 6 МБ памяти!

Предсказываю, что придется перезагружать эти устройства примерно каждые 12 дней, иначе память будет расти до такой степени, что они не смогут запустить процесс SSH, а также начнут теряться heartbeat'ы и AP будут пропадать и появляться в контроллере UniFi.

Думаю, открою тикет в поддержку и приложу ссылку на этот пост. Раньше можно было получать сотни дней непрерывной работы, но похоже, что эти времена прошли, пока mcad продолжает расти из-за какой-то утечки.

У меня есть приличный опыт работы с embedded Linux устройствами, может попробую присоединиться к делу и помочь с отладкой. Спасибо!
 
Этот релиз вышел из беты? Потому что в официальной ссылке на загрузку Ubiquiti он не отображается... последняя версия здесь — 3.9.19 https://www.ubnt.com/download/unifi/unifi-ap-ac-pro/uap-ac-pro
 
3.9.21.8191 уже вышла... https://community.ui.com/releases/598e27e8-2b01-4062-9474-ecac2d981948
 
Когда релиз 3.9.20 выйдет из беты? Спасибо!
 
В общем, я толком так и не решил свою проблему официально. Я просто откатился на старую версию прошивки, и это сработало. Сейчас у меня стоит 3.2.12.2920 — версии, которой пару лет. В моём случае она ведёт себя достаточно стабильно. Я не проводил бинарный поиск, чтобы точно понять, где всё пошло не так. Но у меня сейчас есть другие проблемы, которыми нужно заняться. Похоже, они пытались втиснуть слишком много функций в старое железо OutdoorAP+.  
-C-
 
@windbender

Эта информация помогла вам? Если вы решили свою проблему, не могли бы вы рассказать, в чем она была?
 
Изначально я думал, что у нас утечка памяти, но на самом деле дело было в ресурсах, выделенных для Unifi Controller. У нас было десятки точек доступа и коммутаторов в 7 разных локациях, и всё это управлялось с одного Unifi Cloud Key... После того, как мы перенесли контроллер на сервер с гораздо большим объёмом оперативной памяти и мощным процессором, проблема исчезла.

Если у вас тоже используется Cloud Key, это может помочь: https://help.ubnt.com/hc/en-us/articles/217549368-UniFi-How-many-APs-can-the-Cloud-Key-handle-

Если же контроллер Unifi установлен на сервере или ПК, проверьте, сколько ресурсов выделено для него.

Эта статья тоже нам помогла... у нас была проблема №3: https://help.ubnt.com/hc/en-us/articles/115005159588-UniFi-How-to-Tune-the-Controller-for-High-Number-of-UniFi-Devices

Ещё один вариант для спокойствия — Unifi Elite… https://help.ubnt.com/hc/en-us/articles/115005558808-UniFi-Elite-Device-Licensing-Information

К сожалению, для нас он доступен только в США.
 
Сейчас у меня на UniFi AP-Outdoor+ стоит версия 3.9.24.8264. У меня подключено много малонагруженных устройств (IoT-приложение). Регулярно (примерно каждые 40 минут) эти устройства выходят из строя. Когда это происходит, возможны следующие варианты:

a) перезагрузка;  
b) перезагрузка с последующей необходимостью повторного присоединения;  
c) переход в состояние «отключено», требующее перезапуска;  
d) зависание интерфейса при продолжении передачи трафика;  
e) зависание без передачи трафика.

Перед сбоем я замечаю рост использования памяти до 90% и выше, а показатели «Load avg» тоже поднимаются выше 1–2. У меня есть логи с этих устройств, и я вижу множество проблем с OOM (Out Of Memory), из-за которых процессы принудительно завершаются. Если я захожу посмотреть список процессов, часто обнаруживаю несколько копий mcad, работающих одновременно. Как вы понимаете, это серьёзная проблема для моих установок. В будущем планирую ставить более «мощные» точки доступа, но уже есть большая база таких устройств, которые я бы предпочёл исправить, а не менять.

Считается ли эта проблема уже «закрытой»? По моим наблюдениям — нет.
 
Да, это так, но пока ещё не загружено в репозитории. Подождите ещё недельку примерно, пока появится, если только не хотите установить вручную. Эта тема может помочь понять, почему так происходит. https://community.ui.com/questions/5e49c960-58e4-4464-bf4d-49e3f6465399
Страницы: 1
Читают тему (гостей: 1)