Предопределённые векторы для обучения нейросетей с экономией памяти

Одна из базовых функций систем машинного зрения состоит в классификации объектов. Для решения этой задачи традиционно применяются методы обучения с учителем (SL). Эти методы обеспечивают высокую точность, но при этом размер нейросетевой модели увеличивается с увеличением количества классов. Такая особенность ограничивает применимость SL в тех случаях, когда число классов слишком велико или заранее неизвестно. Эксперт отдела перспективных исследований компании «Криптонит» Никита Габдуллин предложил новую методологию, позволяющую добиться одного и того же размера нейросетевой модели независимо от числа классов. Это достигается за счёт использования предопределённых векторных систем в качестве целевой конфигурации скрытого пространства (Latent Space Configuration, LSC) во время обучения. С проблемой раздувания классов сталкиваются во многих областях — от ритейла до научных исследований. Мы рассмотрим её на задаче распознавания лиц, где каждый человек (его ID) считается отдельным классом. Существующий подход (SL) требует, чтобы размер последнего классификационного слоя был пропорционален количеству этих ID. Когда число идентифицируемых лиц исчисляется миллионами, параметры этого слоя становятся просто астрономическими, а модель — непрактичной из-за непомерных требований к ресурсам (в частности — к видеопамяти). Это становится существенным барьером на пути к масштабированию. В качестве решения этой проблемы эксперт «Криптонита» предложил радикально новый метод — LSC, который устраняет прямую зависимость между размером модели и числом классов. Вместо того, чтобы заставлять сеть запоминать каждый класс во всё увеличивающемся классификационном слое, LSC учит её проецировать входные данные — например, изображения лиц — в заранее заданную, фиксированную систему векторов в абстрактном скрытом пространстве.

https://habr.com/ru/companies/kryptonite/articles/970844/

#нейросети #машинное_обучение #обучение_с_учителем #распознавание_лиц #распознавание_изображений #машинное_зрение #компьютерное_зрение #классификация_изображений

Предопределённые векторы для обучения нейросетей с экономией памяти

Одна из базовых функций систем машинного зрения состоит в классификации объектов. Для решения этой задачи традиционно применяются методы обучения с учителем (SL). Эти методы обеспечивают высокую...

Хабр

Пять лет спустя: почему мы всё переписали с нуля

Пять лет назад на Хабре мы писали о Web Camera Pro — и казалось, что впереди только апдейты, оптимизации и новые функции. За это время изменилось многое — и не только в технологиях, но и в законодательстве. Как мы наступили на те же грабли Когда в 2015 году мы начинали разработку системы для видеонаблюдения , Qt 5 казался идеальным решением. На первый взгляд всё выглядело просто: берём готовые библиотеки, оборачиваем в красивый интерфейс, добавляем AI-аналитику — и готово. На Qt было создано множество известных программ для видеонаблюдения, и мы — как и десятки команд по всему миру, поверили в его универсальность. “Один фреймворк, любая платформа” — звучало как музыка. Первые месяцы казались триумфом: интерфейс ожил, камеры подключались, поток шёл, воспроизведение работало. Qt позволял быстро собрать прототип, но, когда речь заходила о стабильности, о 24/7-нагрузке, о реальной работе с потоками и камерами, его недостатки становились критичны.

https://habr.com/ru/articles/963760/

#видеонаблюдение #система_видеонаблюдения #vms #облачное_видеонаблюдение #qt #машинное_зрение #искусственный_интеллект #камеры_видеонаблюдения #распознавание_лиц #программирование

Пять лет спустя: почему мы всё переписали с нуля

Как мы наступили на те же грабли Пять лет назад на Хабре мы писали о Web Camera Pro — и казалось, что впереди только апдейты, оптимизации и новые функции. За это время изменилось многое — и не только...

Хабр

SmileFace. Когда нейросеть улыбается тебе в ответ

SmileFace — игра, в которой нейросеть угадывает эмоции Мы сделали интерактивный стенд: камера, смайлики и нейросеть, которая пытается распознать, что вы чувствуете. В статье — как это работает, с какими трудностями столкнулись и как запустить игру у себя. Улыбнуться ИИ

https://habr.com/ru/articles/961178/

#нейросеть #эмоции #распознавание_лиц #компьютерное_зрение #python #fastapi #opencv

SmileFace. Когда нейросеть улыбается тебе в ответ

Исходники открыты на GitHub: github.com/konstantinkozhin/SmileFace От идеи до смеха в коридоре Ко Дню программиста в университете нужно было сделать интерактивный стенд — что-то весёлое, но с...

Хабр

Как я распознавание лиц к Yandex Disk-у прикручивал

"Крошка сын к отцу пришел и спросила крошка..." Ну не сын на самом деле, а дочка, но пришла и спросила: "Паааап, у подруги тут ДР, вытащи мне из фотоархива все фото где мы с ней вместе". Да легко!

https://habr.com/ru/articles/959378/

#ydb #Yandex_Vision #yandexcloud #yandex_disk #распознавание_лиц

Как я распознавание лиц к Yandex Disk-у прикручивал

"Крошка сын к отцу пришел и спросила кроха..." Ну не сын на самом деле, а дочка, но пришла и спросила: "Паааап, у подруги тут ДР, вытащи мне из фотоархива все фото где мы с ней вместе". Да легко! Но...

Хабр

Как мы строили KidFolio — цифровую платформу для родителей и детских садов

Массовые фото из детского сада в родительских чатах редко бывают персональными: на десятках снимков сложно найти именно своего ребенка. Выпускники онлайн-магистратуры «Науки о данных» Центра «Пуск» МФТИ предложили решение — платформу KidFolio, которая с помощью технологий компьютерного зрения и мультимодальных моделей автоматически формирует и отправляет родителям персонализированные фото- и видеоотчеты. В статье — подробности разработки: от сбора датасета детских лиц до создания собственного бенчмарка и дообучения моделей для генерации текстов.

https://habr.com/ru/articles/924782/

#компьютерное_зрение #vlm #cv #автоматизация #мультимодальные_модели #генерация_описаний #распознавание_лиц #MLпродукт

Как мы строили KidFolio — цифровую платформу для родителей и детских садов

Мы — Даврон Ихматуллаев и Михаил Назаров — выпускники онлайн-магистратуры «Науки о данных» Центра «Пуск» МФТИ. В рамках дипломной работы и студенческого стартап-проекта мы разработали KidFolio —...

Хабр

Это камень? Это ветка? Это нос! Разбираем подходы, помогающие ИИ распознавать лица на картинках с низким разрешением

Привет, Хабр! Мы – Даниил Соловьев и Михаил Никитин из команды направления распознавания лиц. Сегодня фокусируемся на задаче распознавания лиц на изображениях низкого разрешения (low resolution face recognition, low-res FR). Она актуальна в первую очередь при анализе данных видеонаблюдения, так что если перед вами сейчас стоит подобная задача (или просто интересно, как она решается) — статья для вас. Расскажем про проблемы и сложности распознавания лиц низкого разрешения, подходы к решению задачи, в том числе свежий PETALface с конференции WACV 2025 . Также поделимся ссылками на исследования, которые подробнее освещают каждый подход.

https://habr.com/ru/companies/tevian/articles/921660/

#низкое_качество #низкое_разрешение #распознавание_лиц #глубокое_обучение #компьютерное_зрение #машинное_обучение #обработка_изображений #deep_learning #computer_vision #face_recognition

Это камень? Это ветка? Это нос! Разбираем подходы, помогающие ИИ распознавать лица на картинках с низким разрешением

"Распознать бы этого шакала" Привет, Хабр! Мы – Даниил Соловьев и Михаил Никитин из команды направления распознавания лиц. Сегодня фокусируемся на задаче распознавания лиц на изображениях низкого...

Хабр

ИИ открыл двери для массовой прослушки населения

Шпионаж (прослушка) и наблюдение (слежка) — это разные, но связанные вещи. Если нанять частного детектива для прослушки, то он может спрятать несколько жучков в доме, машине — и в итоге получит отчёт с записями разговоров объекта. Если же ему поручили работу по наблюдению, то содержание отчёта будет другим: куда ходил человек, с кем разговаривал, что покупал, что делал. До появления интернета установить за кем-то наблюдение было дорого и долго. Нужно было вручную следить за человеком, отмечая, куда он ходит, с кем разговаривает, что покупает, что делает и что читает. Но этот старый мир навсегда ушёл в прошлое. Теперь наши телефоны отслеживают местоположение, банковские карты регистрируют покупки, приложения отслеживают, с кем мы разговариваем и что читаем. Компьютеры собирают данные обо всех наших действиях, и по мере удешевления хранения и обработки эти данные всё чаще сохраняются и используются. То, что было индивидуальной работой, сейчас стало массовым. Слежка за людьми стала бизнес-моделью для интернет-компаний , и у нас нет разумного способа отказаться от неё.

https://habr.com/ru/companies/globalsign/articles/893562/

#ИИ #массовая_слежка #шпионаж #Keras #Yolo #камеры_наблюдения #распознавание_лиц #NSO_Group

ИИ открыл двери для массовой прослушки населения

Шпионаж (прослушка) и наблюдение (слежка) — это разные, но связанные вещи. Если нанять частного детектива для прослушки, то он может спрятать несколько жучков в доме, машине — и в итоге получит отчёт...

Хабр

Решение задач распознавания на Flutter

Задачи распознавания изображений и звука имеют широкий спектр применений в различных приложениях. Используя Flutter, как мощный фреймворк для разработки кроссплатформенных мобильных приложений, вполне возможно реализовать функционал распознавания данных в несколько шагов. В этой статье мы рассмотрим некоторые из задач распознавания, такие как распознавание лиц, текста и звука, и приведем фрагменты кода и рекомендуемые библиотеки для их реализации на Flutter.

https://habr.com/ru/articles/890700/

#flutter #распознавание_речи #распознавание_лиц #распознавание_текста #google #ml_kit

Решение задач распознавания на Flutter

Задачи распознавания изображений и звука имеют широкий спектр применений в различных приложениях. Используя Flutter, как мощный фреймворк для разработки кроссплатформенных мобильных приложений, вполне...

Хабр

Прогресс «на лицо»: Сбер и НСПК создают биометрическую альтернативу Apple Pay

После отключения Apple Pay и Google Pay весной 2022 года развитие сферы бесконтактных платежей в нашей стране получило неожиданное ускорение. То, что изначально выглядело как серьезный удар по удобству пользователей, на деле стало мощным стимулом для развития отечественных платежных технологий. Сперва рынок увидел развитие СБПэй и других мобильных платежных систем, а теперь Сбер и НСПК готовят запуск системы биометрических платежей в России.

https://habr.com/ru/companies/x-com/articles/875930/

#xcomshop #оплата_лицом #распознавание_лиц #Сбер #нспк

Прогресс «на лицо»: Сбер и НСПК создают биометрическую альтернативу Apple Pay

Скоро в России заработает оплата лицом для всех После отключения Apple Pay и Google Pay весной 2022 года развитие сферы бесконтактных платежей в нашей стране получило ускорение. То, что изначально...

Хабр

Сложность физической биометрической идентификации монозиготных близнецов

Представьте зал суда. Прокурор с гордостью представляет неопровержимые, как ему кажется, доказательства: отпечаток пальца, запись с камеры наблюдения, ДНК-экспертизу. Всё сходится идеально, виновность очевидна. И тут адвокат, заявляет: «Ваши доказательства подходят и к его брату-близнецу»... Физическая биометрическая идентификация однояйцевых или монозиготных близнецов - частная задача биометрии, актуальная для систем с высокой стоимостью ошибки (например, в оборонке). По сути, задача сводится к одному вопросу - сможет ли система отличить однояйцевых близнецов друг от друга. Но каждый новый кейс сияет ярко, потому что указывает на несовершенства существующих технологий. Эта статья — обзор ключевых биометрических технологий, таких как анализ отпечатков пальцев, распознавание лиц и радужной оболочки. Разберём, в чем сложность идентификации близнецов, рассмотрим результаты исследований и выясним, что уже работает, а что пока остаётся под вопросом. Узнать правду

https://habr.com/ru/articles/870886/

#биометрия #близнецы #распознавание_лиц #отпечатки #радужка #генетика #двойники #идентификация #идентификация_личности #мошенничество

Сложность биометрической идентификации монозиготных близнецов

Представьте зал суда. Прокурор с гордостью представляет неопровержимые, как ему кажется, доказательства: отпечаток пальца, запись с камеры наблюдения, ДНК-экспертизу. Всё сходится идеально, виновность...

Хабр