Как научить планшет видеть несколько объектов в кадре одновременно: multi-label классификация

Представьте, что вам нужно научить камеру планшета почти мгновенно определять, что происходит в кадре. И это не просто «автомобиль» или «человек»: нужно различать и связывать разные категории объектов: документы, людей, QR, штрихкоды и так далее. Казалось бы, достаточно взять предобученную модель и заточить для запуска на конкретном железе, в нашем случае это планшет KVADRA_T. Привет, Хабр! Меня зовут Анастасия Шпилёва и я работаю в команде разработки программных ИИ-компонент MLKit компании YADRO. В статье расскажу, почему я остановилась на multi-label классификации изображений. А также — как я собирала, размечала и валидировала датасет, от которого во многом зависит эффективность модели.

https://habr.com/ru/companies/yadro/articles/1006054/

#ai #компьютерное_зрение #kvadra_t #kvadraos #gemini #gpt #qwen #optuna #claude #mobilenet

Как научить планшет видеть несколько объектов в кадре одновременно: multi-label классификация

Представьте: вам нужно научить камеру планшета почти мгновенно определять, что происходит в кадре. И это не просто «автомобиль» или «человек»: нужно различать и связывать разные категории объектов:...

Хабр

2025년 가장 많이 쓰인 AI 모델 TOP 10: HuggingFace 다운로드 순위

2025년 HuggingFace에서 가장 많이 다운로드된 오픈소스 AI 모델 TOP 10. 거대 모델 대신 효율적이고 실용적인 특화 모델들이 개발 현장을 주도하고 있습니다.

https://aisparkup.com/posts/6602

Real-time-распознавание лиц: методы обучения быстрых и точных моделей для работы на мобильных девайсах

Привет, Хабр! Меня зовут Вадим Селютин, я старший исследователь в компании VisionLabs. Наши решения по распознаванию лиц можно встретить в офисных центрах, московском метро и кассах самообслуживания супермаркетов. Во всех этих кейсах мы используем нейросети, которые адаптируем специально для мобильных устройств. В этой статье я расскажу про постановку задачи распознавания лиц, подходящие мобильные архитектуры, обучение распознаванию лиц на больших объемах данных и способы повысить точность маленькой архитектуры.

https://habr.com/ru/companies/ru_mts/articles/842762/

#visionlabs #распознавание_лиц #обучение_моделей #MobileNet #RegNet #ConvNeXt #GhostNet

Real-time-распознавание лиц: методы обучения быстрых и точных моделей для работы на мобильных девайсах

Привет, Хабр! Меня зовут Вадим Селютин, я старший исследователь в компании VisionLabs. Наши решения по распознаванию лиц можно встретить в офисных центрах, московском метро и кассах самообслуживания...

Хабр
Meta Doesn’t Allow Camera Access On VR Headsets, So Here’s A Workaround

The cameras at the front of Meta’s Quest VR headsets are off-limits to developers, but developer [Michael Gschwandtner] created a workaround (Linkedin post) and shared implementation details …

Hackaday

🎥 In our latest video tutorial, we will dive deep into the world of sports image classification! 🏀📸

Check out our tutorial here : https://youtu.be/xORACIVRNd4

Enjoy

Eran

#Python #openCV #TensorFlow #Deeplearning #DeepLearningTutorial #mobilenet #ImageClassificationTutorial #Sports Image Classification

TensorFlow Sports Image Classification : Building a Custom Model with TensorFlow and Keras

YouTube

🎥 In our latest video tutorial, we will dive deep into the world of sports image classification! 🏀📸

Actually recommend this book for deep learning based on Tensorflow and Keras : https://amzn.to/3STWZ2N

Check out our tutorial here : https://youtu.be/xORACIVRNd4

Enjoy
Eran

#Python #openCV #TensorFlow #Deeplearning #DeepLearningTutorial #mobilenet #ImageClassificationTutorial #SportsImageClassification

Amazon.com