Каталог Поиск 0 Сравнить 0 Закладки 0 Корзина Войти
Каталог
105082, Москва, ул. Фридриха Энгельса, 75с21, БЦ Бауманский ИТКОЛ
Пн - Пт: с 09-00 до 18-00 Сб: с 10-00 до 18-00 Вс: выходной
Страницы: 1
RSS
UniFi Security Gateway 3P становится нестабильным при нагрузке, UniFi Network
 
Один из моих USG сбрасывает все сетевые подключения, как только нагрузка становится чуть выше! Чаще всего падают все VPN-соединения (Site-2-Site), иногда даже сбивается связь с Cloud Key (который локально на том же узле).

Лог просто пестрит такими записями:  
Oct  5 12:26:05 FRA2PSES02 mcad: perl_wrapper.read_with_timeout(): timeout on select() for response pipe  
Oct  5 12:26:05 FRA2PSES02 mcad: perl_wrapper.perl_request_response(): error reading SOM  
Oct  5 12:26:08 FRA2PSES02 mcad: perl_wrapper.read_with_timeout(): timeout on select() for response pipe  
Oct  5 12:26:08 FRA2PSES02 mcad: perl_wrapper.perl_request_response(): error reading SOM  
Oct  5 12:26:10 FRA2PSES02 mcad: perl_wrapper.read_with_timeout(): timeout on select() for response pipe  
Oct  5 12:26:12 FRA2PSES02 mcad: perl_wrapper.perl_request_response(): error reading SOM  
Oct  5 12:26:14 FRA2PSES02 mcad: perl_wrapper.read_with_timeout(): timeout on select() for response pipe  
Oct  5 12:26:14 FRA2PSES02 mcad: perl_wrapper.perl_request_response(): error reading SOM  
Oct  5 12:26:14 FRA2PSES02 mcad: mca-edgemax.egdemax_stats_vpn_status(): error getting VPN status  
Oct  5 12:26:24 FRA2PSES02 perl_wrapper: Timeout opening /var/run/perl_wrapper_resp_fifo at /usr/bin/perl_wrapper.pl line 51.  
Oct  5 12:26:24 FRA2PSES02 perl_wrapper: 22 open retries at /usr/bin/perl_wrapper.pl line 58.  
Oct  5 12:26:24 FRA2PSES02 perl_wrapper: timeout opening response FIFO for write at /usr/bin/perl_wrapper.pl line 209.  
Oct  5 12:26:24 FRA2PSES02 perl_wrapper: request_response returned error at /usr/bin/perl_wrapper.pl line 301.  
Oct  5 12:29:36 FRA2PSES02 mcad: perl_wrapper.read_with_timeout(): timeout on select() for response pipe  
Oct  5 12:29:36 FRA2PSES02 mcad: perl_wrapper.perl_request_response(): error reading SOM  
Oct  5 12:29:38 FRA2PSES02 mcad: perl_wrapper.read_with_timeout(): timeout on select() for response pipe  
Oct  5 12:29:38 FRA2PSES02 mcad: perl_wrapper.perl_request_response(): error reading SOM  
Oct  5 12:29:40 FRA2PSES02 mcad: perl_wrapper.read_with_timeout(): timeout on select() for response pipe  
Oct  5 12:29:40 FRA2PSES02 mcad: perl_wrapper.perl_request_response(): error reading SOM  
Oct  5 12:29:42 FRA2PSES02 mcad: perl_wrapper.read_with_timeout(): timeout on select() for response pipe  
Oct  5 12:29:43 FRA2PSES02 mcad: perl_wrapper.perl_request_response(): error reading SOM  
Oct  5 12:29:43 FRA2PSES02 mcad: mca-edgemax.egdemax_stats_vpn_status(): error getting VPN status  
Oct  5 12:29:52 FRA2PSES02 perl_wrapper: Timeout opening /var/run/perl_wrapper_resp_fifo at /usr/bin/perl_wrapper.pl line 51.  
Oct  5 12:29:52 FRA2PSES02 perl_wrapper: 29 open retries at /usr/bin/perl_wrapper.pl line 58.  
Oct  5 12:29:52 FRA2PSES02 perl_wrapper: timeout opening response FIFO for write at /usr/bin/perl_wrapper.pl line 209.  
Oct  5 12:29:52 FRA2PSES02 perl_wrapper: request_response returned error at /usr/bin/perl_wrapper.pl line 301.  
Oct  5 12:32:12 FRA2PSES02 mca-monitor: mca-client.service(): Failed sending request to '/tmp/.mcad' - 'Resource temporarily unavailable'  
Oct  5 12:33:34  mca-monitor: last message repeated 3 times  
Oct  5 12:34:34  mca-monitor: last message repeated 4 times  
Oct  5 12:35:14 FRA2PSES02 mcad: perl_wrapper.read_with_timeout(): timeout on select() for response pipe  
Oct  5 12:35:14 FRA2PSES02 mcad: perl_wrapper.perl_request_response(): error reading SOM  
Oct  5 12:35:15 FRA2PSES02 mca-monitor: mca-client.service(): Failed sending request to '/tmp/.mcad' - 'Resource temporarily unavailable'  
Oct  5 12:35:17 FRA2PSES02 mcad: perl_wrapper.read_with_timeout(): timeout on select() for response pipe  
Oct  5 12:35:17 FRA2PSES02 mcad: perl_wrapper.perl_request_response(): error reading SOM  
Oct  5 12:35:19 FRA2PSES02 mcad: perl_wrapper.read_with_timeout(): timeout on select() for response pipe  
Oct  5 12:35:19 FRA2PSES02 mcad: perl_wrapper.perl_request_response(): error reading SOM  
Oct  5 12:35:22 FRA2PSES02 mcad: perl_wrapper.read_with_timeout(): timeout on select() for response pipe  
Oct  5 12:35:22 FRA2PSES02 mcad: perl_wrapper.perl_request_response(): error reading SOM  
Oct  5 12:35:22 FRA2PSES02 mcad: mca-edgemax.egdemax_stats_vpn_status(): error getting VPN status  
Oct  5 12:35:34 FRA2PSES02 perl_wrapper: Timeout opening /var/run/perl_wrapper_resp_fifo at /usr/bin/perl_wrapper.pl line 51.  
Oct  5 12:35:35 FRA2PSES02 perl_wrapper: 16 open retries at /usr/bin/perl_wrapper.pl line 58.  
Oct  5 12:35:35 FRA2PSES02 perl_wrapper: timeout opening response FIFO for write at /usr/bin/perl_wrapper.pl line 209.  
Oct  5 12:35:35 FRA2PSES02 perl_wrapper: request_response returned error at /usr/bin/perl_wrapper.pl line 301.  
Oct  5 12:36:00 FRA2PSES02 mca-monitor: mca-client.service(): Failed sending request to '/tmp/.mcad' - 'Resource temporarily unavailable'  
Oct  5 12:36:36  mca-monitor: last message repeated 3 times  
Oct  5 12:36:36 FRA2PSES02 syswrapper: kill-mcad. reason: mcad not responding  
Oct  5 12:36:51 FRA2PSES02 mcad: ace_reporter.set_default_localtime(): failed to get /usr/lib/build.properties  
Oct  5 12:37:05 FRA2PSES02 redirector: redirector.sigint_handler(): receive signal 15  
Oct  5 12:38:53 FRA2PSES02 kernel: [sched_delayed] sched: RT throttling activated
Oct  5 12:41:52 FRA2PSES02 mcad: ace_reporter.create_socket(): create_socket(ipv4): SO_LINGER 2:No such file or directory  
Oct  5 12:41:52 FRA2PSES02 mcad: mcad-discover.init_mcast_sock(): init_mcast_socket(ipv4): SO_LINGER 2:No such file or directory

С тех пор, как я впервые заметил эту проблему, ситуация ухудшилась: если я скачиваю ISO (в моем примере — последний Centos ISO), USG становится очень нестабильным!!!

Настройка:  
Модель: UniFi Security Gateway 3P  
Версия: 4.4.29.5124210  
CLOUD KEY: UCK.mtk7623.v0.12.0.29a26c9.181001.1444  
Версия контроллера: 5.8.30-11076-1  
Offload включён.

Я также заметил, что speedtest с некоторых пор выдаёт очень странные значения:  
Скорость подключения всего 90Mbps/30Mbps, но иногда скорость загрузки превышает 100Mbps! Мой провайдер — Deutsche Telekom, VDSL/PPPOE модем — Vigor 130. Если я использую Vigor как роутер, соединение очень(!) стабильное, и speedtest не показывает никаких странных пиков. Но двойной NAT USG обрабатывает очень (очень) плохо, поэтому я всеми силами стараюсь его избежать.

Больше подробностей есть в другом моём посте, который я упоминал выше. Есть идеи?
 
Привет, @edwarj3,

Я очень рано изменил MTU на 1492. Об этом написано в моём блоге. Время от времени вижу это сообщение (и при нагрузке, и без неё). Иногда, когда нагрузка высокая, USG становится нестабильным и сбрасывает все активные соединения. Корень проблемы я так и не нашёл. Но есть одно: у меня в офисе работает WSUS-сервер. После последнего дня обновлений снова заметил нестабильность USG. Я использую удалённый логинг (syslog и Graylog), и примерно через 30 секунд после появления сообщения в логах фиксируется завершение обеих постоянных VPN-соединений. С последней прошивкой ситуация изменилась: стало лучше! Намного лучше, но проблема всё ещё не решена.
 
Спасибо, Джош. У меня эти сообщения, кажется, появляются случайно, а не когда сеть под большой или какой-то конкретной нагрузкой. И могут появляться как по одному, так и сразу несколько. Я пытался сопоставить их с другими событиями (у меня настроен Syslog-сервер, который собирает логи почти со всех устройств в один общий файл), но ничего, что бы совпадало, не нашёл.

В некоторых постах говорят, что это может быть связано с IPV6 и настройкой MTU между USG и модемом. Какое у тебя стоит значение MTU? Есть ли у тебя IPV6-трафик, который мог бы это вызывать?

У меня модем Vigor 130, подключенный к BT в Великобритании, MTU выставлен на 1492. Где-то читал, что лучше 1500, и, глядя на сообщения при загрузке USG, похоже, он меняет MTU с 1500 на 1492... Может, я попробую поставить 1500 и посмотрю, что будет. IPV6 у меня не настроен, но, возможно, какое-то устройство время от времени его запрашивает.

Что думаешь по этому поводу? Может, в этом и есть причина?
 
Привет @edwarj3, нет! Это происходит и с последней прошивкой. Гораздо лучше, но время от времени всё равно случается. Как я заметил, чаще всего это происходит, когда система перегружена (много трафика). Отключение автоматического (по расписанию) теста скорости сильно снизило частоту таких сбоев на моём USG. Но время от времени всё равно случается, и тогда большинство соединений обычно обрывается.
 
Кто-нибудь понял причину появления сообщений «mcad: perl_wrapper.perl_request_response(): ошибка при чтении SOM»??
Страницы: 1
Читают тему (гостей: 1)