Каталог Поиск 0 Сравнить 0 Закладки 0 Корзина Войти
Каталог
105082, Москва, ул. Фридриха Энгельса, 75с21, БЦ Бауманский ИТКОЛ
Пн - Пт: с 09-00 до 18-00 Сб: с 10-00 до 18-00 Вс: выходной
Страницы: 1
RSS
UNAS Pro 4 — подключения NFS и SMB разрываются / монтирования устаревают, UniFi Drive
 
У меня серьёзные проблемы со стабильностью моего нового UNAS Pro 4 NAS, которые сводят меня с ума и, по сути, делают устройство непригодным к использованию. Я изучил множество постов в соцсетях, перепробовал кучу разных конфигураций SMB и NFS — всё безрезультатно. Я подключал несколько ИИ-инструментов для отладки, но все они пришли к одному и тому же выводу, и я дошёл до того момента, что мне некомфортно применять предложенные изменения без подтверждения от @UI-Team или других пользователей, которые сталкивались с этой же проблемой и решили её. У меня открыт тикет в поддержку, но хотелось бы узнать, сталкиваются ли другие участники сообщества с той же проблемой, чтобы, надеюсь, однажды мы смогли поделиться решением.

Проблема
У меня часто происходят разрывы соединений NFS и SMB на моём UNAS Pro 4, из-за чего Plex (и другие клиенты) теряют доступ к медиафайлам. Проблема возникает как с протоколом NFS, так и с SMB, что заставило меня копать глубже в поисках первопричины, а не винить конкретный протокол.

Симптомы:
Plex останавливает воспроизведение медиа на середине потока или не может загрузить библиотеки
Клиенты NFS сообщают об устаревших файловых дескрипторах (stale file handles)
Смонтированные SMB-шары перестают отвечать
Переподключение (перемонтирование) временно решает проблему, но она повторяется в течение нескольких часов

Моя конфигурация:
UNAS Pro 4 под управлением UniFi Drive (ядро 5.10.216-alpine-unas, aarch64)
2x WD Ultrastar 16 ТБ (WUH721816ALE6L4) в UNAS
Клиенты: хост Proxmox (LXC-контейнер Plex через SMB bind mount), сервер Ubuntu (Docker-контейнеры через NFS)
Сеть: коммутация UniFi, подключение 1GbE (также тестировал с SFP+ DAC — та же проблема)

Анализ первопричины
1. Обрывы сокетов NFS в dmesg
rpc-srv/tcp: nfsd: sent 92928 when sending 131200 bytes - shutting down socket
rpc-srv/tcp: nfsd: got error -11 when sending 120 bytes - shutting down socket
rpc-srv/tcp: nfsd: sent 128892 when sending 131200 bytes - shutting down socket
Эти ошибки указывают на то, что демон NFS пытается отправить данные, но буфер отправки TCP переполнен. Вместо повторной попытки ядро закрывает сокет, отключая клиента. Ошибка -11 — это EAGAIN (буфер временно заполнен).

2. Значительные потери пакетов на сетевом интерфейсе
После свежей перезагрузки, примерно через 25 минут:
enp0s0: 7347675   28335    0 1705    0     0          0      4821 ...
Это 1705 потерянных RX-пакетов за меньше чем полчаса. Это было стабильно как на порту 1GbE (enp0s0), так и на порту SFP+ (enp0s1), что исключает проблему с кабелем или портом.

3. Исследование параметров ядра
Я проверил стандартные настройки ядра на UNAS и обнаружил три параметра, которые значительно занижены для NAS-нагрузок:
Кольцевой буфер (очередь приёма/передачи сетевого адаптера):
# ethtool -g enp0s0
Pre-set maximums:
RX: 8192
TX: 8192
Current hardware settings:
RX: 1024    <-- Только 12.5% от максимума
TX: 1024
Сетевой адаптер поддерживает 8192 записей, но по умолчанию стоит 1024. Это означает, что буфер сетевой карты заполняется до того, как ядро успевает обработать пакеты, что приводит к потерям. Это напрямую объясняет количество потерянных пакетов.
Максимальные размеры TCP-буферов сокетов:
net.core.wmem_max = 262144      (256 КБ — слишком мало для размеров блоков NFS)
net.core.rmem_max = 262144      (256 КБ)
net.ipv4.tcp_wmem = 65536 131072 16777216
net.ipv4.tcp_rmem = 65536 131072 134217728
Значение wmem_max в 256 КБ — это жёсткий потолок для TCP-буферов отправки. NFS пытается отправлять блоки размером 131200 байт и упирается в этот потолок под нагрузкой, что и вызывает ошибки "shutting down socket".
Потоки демона NFS:
# cat /proc/fs/nfsd/threads
8
Всего 8 потоков NFS для обслуживания нескольких одновременных потоковых клиентов. Когда все потоки заняты, новые запросы ставятся в очередь, усугубляя давление на буферы.

Предлагаемое исправление
Это стандартные параметры настройки ядра Linux, а не хаки. Указанные ниже значения широко рекомендуются для нагрузок NAS/файловых серверов:
Увеличить кольцевые буферы:
ethtool -G enp0s0 rx 4096 tx 4096
Увеличить максимальные размеры TCP-буферов:
sysctl -w net.core.wmem_max=16777216
sysctl -w net.core.rmem_max=16777216
sysctl -w net.core.wmem_default=1048576
sysctl -w net.core.rmem_default=1048576
Увеличить количество потоков NFS:
echo 16 > /proc/fs/nfsd/threads

Вопросы сообществу
Сталкивался ли кто-нибудь ещё с подобными разрывами соединений NFS/SMB на UNAS Pro или UNAS Pro 4? Мне было бы интересно узнать, видят ли другие такие же потери пакетов и стандартные размеры кольцевых буферов.
Сохраняются ли эти параметры ядра после обновлений прошивки? Я подозреваю, что обновление UniFi Drive сбросит /etc/sysctl.conf и настройки кольцевых буферов. Кто-нибудь нашёл постоянный способ применения кастомных настроек ядра на UNAS?
Может ли Ubiquiti рассмотреть возможность установки более подходящих значений по умолчанию для этих параметров? UNAS создан специально как NAS — ядро должно быть настроено для постоянной работы с файлами, а не для стандартных настроек. Увеличение кольцевого буфера с 1024 до 4096 и повышение wmem_max хотя бы до 4 МБ, скорее всего, устранило бы эти проблемы для большинства пользователей.
Есть ли у кого-то UNAS Pro (7-отсеков) и желание проверить свои значения? Мне хотелось бы знать, отличаются ли настройки по умолчанию между моделями Pro и Pro 4. Проверить можно так:
ethtool -g enp0s1
cat /proc/sys/net/core/wmem_max
cat /proc/fs/nfsd/threads

Детали окружения
Модель: UNAS Pro 4
Прошивка: UniFi Drive (актуальная на март 2026)
Ядро: 5.10.216-alpine-unas (aarch64)
Диски: 2x WD Ultrastar HC550 16 ТБ (7200 RPM), SMART здоров, 432 часа работы
Сеть: Тестировалось как на 1GbE (enp0s0), так и на 10GbE SFP+ (enp0s1) на UDM Pro SE и на USW Pro Max 16 POE — поведение одинаковое
Память: 8 ГБ, около 5 ГБ доступно в buff/cache, минимальное использование swap
Средняя загрузка: 1.08, 1.19, 1.25
SMART: Нет ошибок, нет переназначенных секторов, нет отложенных секторов
 
Привет, ты пробовал раннюю версию Drive OS? Мне она помогла.
 
Heyo danky, да, я вижу те же самые таймауты/зависания. Это исправлено в ранней версии UniFi OS/Drive OS на UNAS-Pro-4. Моя конфигурация приложена в виде «упрощённой схемы». Кольца предполагают агрегацию портов. Два коммутатора — это один логически и два физически. Все порты — 10 Гбит/с.
 
Привет, это новейшая версия раннего доступа. У меня она тоже работает.
 
У меня вообще нет таймаутов SMB, я регулярно передаю большие файлы 45 ГБ+ в фоне.  
Ранний доступ:  
UniFi Drive 4.1.16  
UniFi Drive Application 4.2.2  
UDM PRO > SFP+ > XG 10 POE < SFP+ < UNAS-PRO
 
@Nick-St, то есть ты перешел с UNAS -> UDM Pro SE <- Хост с таймаутами на UDM Pro -> Свитч <- UNAS                         ^ ХостИ в новой конфигурации нет таймаутов?
 
@meddesel, можешь описать свою конфигурацию подробнее? Пытаюсь понять, как это устроено. Это UNAS — 10G SFP+ -> UXG <- 1G Eth — (какой-то хост, монтирующий UNAS)? И у тебя те же самые таймауты/зависания?
 
Небольшое обновление: меня так достали эти проблемы, что я попробовал рекомендованные исправления от @stoorren. К сожалению, мне это ничем не помогло, но я обновился до Early Access Drive и UniFi OS, и это, похоже, решило мои проблемы с SMB к UNAS.
 
Я тоже столкнулся с той же проблемой с UXG-Enterprise.
 
Я испытываю то же самое. UNAS Pro подключен через DAC к USW-Aggregation, а хост Proxmox подключен к UDM Pro. Проблемы с соединением возникают при передаче больших объемов данных. Скорее всего, во время бэкапов. Надеюсь, Ubiquiti скоро выпустит исправленную прошивку для UDM.
 
У меня тоже были проблемы с SMB на новом UNAS Pro 4 на одном объекте, пока он был подключен к UDM Pro SE — перемещение UNAS на другой коммутатор решило проблему.
 
Привет, @stoorren, есть новости по этому поводу?
 
@UI-Team могу я тоже получить ту прошивку UDM SE? У меня точно такая же проблема.
 
Привет, @dankyMcNetwork, @professormadman, @mgrago. Спасибо, что подтвердили, что у вас те же проблемы — приятно знать, что это не только у меня. Хочу поделиться обновлением по моему обращению в поддержку (тикет #5441446), которое может быть актуально для всех. В привязанной теме конфигурация похожа на мою, но я не тестировал конкретный случай подключения UNAS и сервера к портам коммутатора UDM Pro SE. Изначально UNAS был подключён к UDM через SFP, сервер — к коммутатору UDM (этот случай был бы похож на проблемный из упомянутой темы). Однако затем я получил свой USW-Pro-Max-16-PoE и перенёс туда и UNAS, и сервер. Что выяснила поддержка Ubiquiti После долгой переписки с командой UniFi Drive Escalation, Ubiquiti заподозрила, что проблема вызвана сетевыми задержками UDM Pro SE, которые в итоге приводили к зависанию демона SMB/NFS на UNAS. Они предоставили кастомную прошивку для UDM Pro SE для тестирования (v5.0.10+root.29842, установка через ubnt-systool fwupdate). Полагаю, это то же самое ПО, которое @UI-Team предлагает в личном сообщении в этой теме. Моя конфигурация для справки UNAS Pro 4 → SFP-DAC 10GbE → USW-Pro-Max-16-PoE → SFP-DAC 10 GbE → UDM Pro SE (хотя проблемы также сохранялись при подключении UNAS Pro 4 → SFP-DAC 10GbE → UDM Pro SE, а также при UNAS Pro 4 → RJ45 1GbE → USW-Pro-Max-16-PoE → SFP-DAC 10 GbE → UDM Pro SE. Кажется, я не пробовал подключаться к порту RJ45 LAN на самом UDM). 3 клиента (Proxmox, Ubuntu server 1, Ubuntu server 2) в одной VLAN, на разных коммутаторах SMB (mount.cifs, vers=3.0) и NFS v3 Автоматический мониторинг watchdog каждые 5 минут + диагностическое логирование с интервалом 30 секунд (настроено после подозрений, что проблема из-за SMB) Результаты после обновления прошивки После установки кастомной прошивки UDM и перезагрузки UNAS сервис SMB стабильно работает 12 дней без единого сбоя по всем источникам мониторинга. Раньше демон SMB стабильно зависал через 5–7 дней, и всегда требовалась полная перезагрузка NAS для восстановления. systemctl status smbd на UNAS подтверждает, что smbd работает непрерывно с момента перезагрузки, с чистым журналом аудита. Стоит отметить, что примерно в то же время я перенёс основную нагрузку (Plex) с SMB на NFS, что тоже показалось стабильнее, так что не могу полностью изолировать, какое изменение повлияло сильнее. Однако watchdog SMB всё ещё активно тестирует монтирование SMB каждые 5 минут, и оно остаётся стабильным — чего никогда не было раньше. Исходя из этого, я осторожно оптимистичен и запросил поддержку, можно ли распространить предоставленную прошивку среди сообщества. Как только получу подтверждение, я поделюсь ссылкой — мне очень интересно, решит ли эта прошивка проблему и у вас (при условии, что у вас тоже UDM Pro/SE).
 
@professormadman Исходя из моего исследования и информации в ветке, которой я поделился, это аппаратная проблема внутри UDM.
UDM
┌───────────────────────────────────────────────────────────­───────────────┐
│                                                                          │
│                         ┌───────────────┐                                │
│  10GbE SFP+ ───────────►│               │                                │
│                         │     CPU       │                                │
│      2.5GbE ───────────►│               │                                │
│                         │               │                                │
│  10GbE SFP+ ───────────►│               │                                │
│                         └───────┬───────┘                                │
│                                 │                                        │
│                        1 Gbps внутренний аплинк                          │
│                                 │                                        │
│                 ┌───────────────▼──────────────────────────────┐         │
│                 │                Коммутатор 1GbE                │         │
│                 └──┬──┬──┬──┬──┬──┬──┬──┬──────────────────────┘         │
│                    │  │  │  │  │  │  │  │                                │
│                   [1][2][3][4][5][6][7][8] │
│                     8 × 1GbE Ethernet портов                             │
│                                                                          │
└───────────────────────────────────────────────────────────­───────────────┘
Все 8 портов 1GbE используют один внутренний канал 1 Гбит/с для связи с CPU. Когда устройство на порту 10GbE SFP+ отправляет данные на любой из 8 портов 1GbE, трафик проходит через этот канал. При постоянной нагрузке он перегружается, из-за чего коммутатор молча сбрасывает пакеты, включая повторные передачи TCP, что делает восстановление невозможным.
 
После недели мучений, когда раздражение только росло, я ради эксперимента переключился с SFP+ на RJ45 между UNAS Pro и UDM, и проблема исчезла полностью. Запустил бекапы, верификацию, очистку и другие операции — PBS-сервер ни разу не дрогнул. Ни единой проблемы с подключением в syslog, ни одного тайм-аута NFS-сокета в логах UNAS Pro. Я даже вернул настройки монтирования NFS к значениям по умолчанию, убрав «кастрированные» размеры блоков данных rsize и wsize. Эта замена SFP+ на RJ45 пока для меня ничего не решает, так как остальная часть стека всё равно работает на 1GbE, но в будущем я хотел бы перевести хост Proxmox и PBS на 10GbE. Обратите внимание: за это время вышло обновление, и теперь у UNAS Pro версия: UniFi OS 5.0.17 Drive 4.1.16 Эти обновления установились до перехода с SFP+ на RJ45, и проблема на соединении SFP+ всё ещё возникала. Теперь мне интересно: проблема в UNAS Pro или в UDM при обработке трафика между портами ETH 1–8 и интерфейсом SFP+?
 
У меня были проблемы со всем медным оборудованием в связке с Plex и Proxmox.
 
@stoorren @professormadman Видели этот тред: https://community.ui.com/questions/UDM-Pro-SE-design-issue-Mixed-speed-port-bridging-breaks-TCP-transfers/1114a18f-ab79-4c8c-89f0-0d404dd849d9 Интересно, есть ли у кого-то из вас похожая конфигурация. В итоге я оставил свой UNAS Pro подключённым через SFP+ к UDM-SE для систем с низкой пропускной способностью. Затем напрямую соединил UNAS с NUC через Ethernet. Настроил NUC раздавать DHCP, чтобы он обеспечивал маршруты, не мешающие основному интернет-трафику (они общаются в диапазоне 172.16.X.Y, а моя основная сеть — 10/8). Переключился на монтирование NFS-шары через Ethernet, и таймауты исчезли.
 
+1. У меня 7-отсековый UNAS Pro, и я испытываю то же самое, что вы описали. Могу подтвердить, что все настройки такие же, как вы описали, @stoorren
Страницы: 1
Читают тему (гостей: 1)