Я написал классную маленькую утилиту на Python, которая отслеживает камеры безопасности UniFi Protect и использует OpenAI's GPT-4o Vision LLM для обнаружения определенных событий. Благодаря LLM правила событий могут быть очень сложными, например, можно отслеживать парковочные места, искать енотов или проверять погоду. Если GPT-4o понимает, то, должно сработать. Система анализирует видеопотоки камер в реальном времени и может отправлять уведомления с изображениями через Pushover при обнаружении событий. Написана на Python, работает на хосте или в Docker-контейнере, является open source (Apache 2.0) и относительно недорогой в эксплуатации (для меня около ~$0.25/день). Пример вывода на изображении выше. Исходный код на GitHub здесь: Изначально я разработал её, чтобы обнаруживать енотов, пытающихся поймать рыбу в нашем пруду. Оповещения Unifi не могут отличить енота от опоссума и кошки, поэтому нам нужно было больше. Если вы хотите запустить локальную модель вместо использования OpenAI, это должно быть легко изменить. Буду рад получить обратную связь и комментарии.
