Привет! Сегодня обновился до ctrl v4.8.14 для конференции (250 человек); смешанная среда из 6 UAP-AC-PRO и 10 UAP-PRO, используется RSSI, Bandsteering ("перенаправление на 5G" для всех), работает на фирменной прошивке, только что обновленной. UAP-AC используются в зонах с высокой плотностью (фойе, главный лекционный зал).
Устройства были перезагружены накануне ночью, аптайм без пользователей — около 9 часов к началу мероприятия. Утро прошло неплохо: перенаправление работало, проблем не было. Через несколько часов заметили, что на 5 из 6 AC-PRO: либо нет пользователей на 5 ГГц, либо всего 2-3 подключения, большинство же переключилось на 2.4 ГГц.
Сканирование эфира перед устройствами не показывает BSSID, как будто 5 ГГц-точек доступа больше не работает. Проверка Arping на некоторых устройствах за затронутыми и незатронутыми AP показывает: пользователи 2.4 ГГц на проблемных AP доступны по пингу, а пользователи на 5 ГГц — нет.
Давайте посмотрим на один из проблемных AP:
iwconfig показывает интерфейсы 5 ГГц, ath3 и ath4:
ath3 IEEE 802.11ac ESSID: "OaM" Режим: Master Частота: 5.18 ГГц Точка доступа: 46:D9:E7:FE:20:94 Скорость: 288.9 Мбит/с Tx-Поток=20 dBm RTS thr: off Fragment thr: off Ключ шифрования: 70DF-4F45-D269-C4DA-2B0E-CDBA-FBB9-15FE [2] Режим безопасности: открытый Управление питанием: выкл Качество связи=30/94 Уровень сигнала=-66 dBm Уровень шума=-107 dBm Rx invalid nwid:70646 Rx invalid crypt:0 Rx invalid frag:0 Tx excessive retries:0 Invalid misc:0 Пропущено маяков: 0
ath4 IEEE 802.11ac ESSID: "OERde" Режим: Master Частота: 5.18 ГГц Точка доступа: 56:D9:E7:FE:20:94 Скорость: 288.9 Мбит/с Tx-Поток=20 dBm RTS thr: off Fragment thr: off Ключ шифрования: выкл Управление питанием: выкл Качество связи=30/94 Уровень сигнала=-66 dBm Уровень шума=-107 dBm Rx invalid nwid:37251 Rx invalid crypt:7 Rx invalid frag:0 Tx excessive retries:0 Invalid misc:0 Пропущено маяков: 0
По сравнению с 2.4 ГГц, значения Rx invalid остались прежними. В ifconfig счетчики RX и TX для ath4 (ath3 не используется пользователями) тоже стоят на месте.
Смотрим dmesg, в начале буфера много таких сообщений:
[40438.780000] [wifi1] FWLOG: [41426839] BEACON_EVENT_SWBA_SEND_FAILED (0x2)
[40438.780000] [wifi1] FWLOG: [41426891] BEACON_EVENT_SWBA_SEND_FAILED (0x1)
[40438.780000] [wifi1] FWLOG: [41426944] BEACON_EVENT_SWBA_SEND_FAILED (0x2)
... (много повторений) ...
Через некоторое время появляется следующее:
[40448.790000] [wifi1] FWLOG: [41438059] BEACON_EVENT_SWBA_SEND_FAILED (0x2)
[40449.490000] ieee80211_ioctl_kickmac[14666]
[40449.600000] ... множество WMI-команд и событий ...
[40449.600000] [wifi1]: XXX TARGET ASSERTED XXX
[40449.610000] HIFDiagReadMem failure (0x12100804)
[40449.610000] HifDiagReadiMem FW Dump Area Pointer failed
[40462.600000] ieee80211_ioctl_kickmac[14666]
После этого повторяется только последняя строка:
[40852.970000] ieee80211_ioctl_kickmac[14666]
[... повторяется очень много раз ...]
[54031.500000] ieee80211_ioctl_kickmac[14666]
Неужели я наткнулся на какую-то ошибку? Могу помочь с отладкой? Событие длится уже больше 6 часов, я либо на месте физически, либо подключаюсь удаленно.
После перезагрузки одного из затронутых устройств оно показывает пользователей в 2G: 1, в 5G: 32, а теперь наоборот: 2G — 15, 5G — 0.
Обновление: я оставил одно устройство без изменений! Если нужны дампы — скажите, какие команды использовать!
Устройства были перезагружены накануне ночью, аптайм без пользователей — около 9 часов к началу мероприятия. Утро прошло неплохо: перенаправление работало, проблем не было. Через несколько часов заметили, что на 5 из 6 AC-PRO: либо нет пользователей на 5 ГГц, либо всего 2-3 подключения, большинство же переключилось на 2.4 ГГц.
Сканирование эфира перед устройствами не показывает BSSID, как будто 5 ГГц-точек доступа больше не работает. Проверка Arping на некоторых устройствах за затронутыми и незатронутыми AP показывает: пользователи 2.4 ГГц на проблемных AP доступны по пингу, а пользователи на 5 ГГц — нет.
Давайте посмотрим на один из проблемных AP:
iwconfig показывает интерфейсы 5 ГГц, ath3 и ath4:
ath3 IEEE 802.11ac ESSID: "OaM" Режим: Master Частота: 5.18 ГГц Точка доступа: 46:D9:E7:FE:20:94 Скорость: 288.9 Мбит/с Tx-Поток=20 dBm RTS thr: off Fragment thr: off Ключ шифрования: 70DF-4F45-D269-C4DA-2B0E-CDBA-FBB9-15FE [2] Режим безопасности: открытый Управление питанием: выкл Качество связи=30/94 Уровень сигнала=-66 dBm Уровень шума=-107 dBm Rx invalid nwid:70646 Rx invalid crypt:0 Rx invalid frag:0 Tx excessive retries:0 Invalid misc:0 Пропущено маяков: 0
ath4 IEEE 802.11ac ESSID: "OERde" Режим: Master Частота: 5.18 ГГц Точка доступа: 56:D9:E7:FE:20:94 Скорость: 288.9 Мбит/с Tx-Поток=20 dBm RTS thr: off Fragment thr: off Ключ шифрования: выкл Управление питанием: выкл Качество связи=30/94 Уровень сигнала=-66 dBm Уровень шума=-107 dBm Rx invalid nwid:37251 Rx invalid crypt:7 Rx invalid frag:0 Tx excessive retries:0 Invalid misc:0 Пропущено маяков: 0
По сравнению с 2.4 ГГц, значения Rx invalid остались прежними. В ifconfig счетчики RX и TX для ath4 (ath3 не используется пользователями) тоже стоят на месте.
Смотрим dmesg, в начале буфера много таких сообщений:
[40438.780000] [wifi1] FWLOG: [41426839] BEACON_EVENT_SWBA_SEND_FAILED (0x2)
[40438.780000] [wifi1] FWLOG: [41426891] BEACON_EVENT_SWBA_SEND_FAILED (0x1)
[40438.780000] [wifi1] FWLOG: [41426944] BEACON_EVENT_SWBA_SEND_FAILED (0x2)
... (много повторений) ...
Через некоторое время появляется следующее:
[40448.790000] [wifi1] FWLOG: [41438059] BEACON_EVENT_SWBA_SEND_FAILED (0x2)
[40449.490000] ieee80211_ioctl_kickmac[14666]
[40449.600000] ... множество WMI-команд и событий ...
[40449.600000] [wifi1]: XXX TARGET ASSERTED XXX
[40449.610000] HIFDiagReadMem failure (0x12100804)
[40449.610000] HifDiagReadiMem FW Dump Area Pointer failed
[40462.600000] ieee80211_ioctl_kickmac[14666]
После этого повторяется только последняя строка:
[40852.970000] ieee80211_ioctl_kickmac[14666]
[... повторяется очень много раз ...]
[54031.500000] ieee80211_ioctl_kickmac[14666]
Неужели я наткнулся на какую-то ошибку? Могу помочь с отладкой? Событие длится уже больше 6 часов, я либо на месте физически, либо подключаюсь удаленно.
После перезагрузки одного из затронутых устройств оно показывает пользователей в 2G: 1, в 5G: 32, а теперь наоборот: 2G — 15, 5G — 0.
Обновление: я оставил одно устройство без изменений! Если нужны дампы — скажите, какие команды использовать!
