Как научить планшет видеть несколько объектов в кадре одновременно: multi-label классификация
Представьте, что вам нужно научить камеру планшета почти мгновенно определять, что происходит в кадре. И это не просто «автомобиль» или «человек»: нужно различать и связывать разные категории объектов: документы, людей, QR, штрихкоды и так далее. Казалось бы, достаточно взять предобученную модель и заточить для запуска на конкретном железе, в нашем случае это планшет KVADRA_T. Привет, Хабр! Меня зовут Анастасия Шпилёва и я работаю в команде разработки программных ИИ-компонент MLKit компании YADRO. В статье расскажу, почему я остановилась на multi-label классификации изображений. А также — как я собирала, размечала и валидировала датасет, от которого во многом зависит эффективность модели.
https://habr.com/ru/companies/yadro/articles/1006054/
#ai #компьютерное_зрение #kvadra_t #kvadraos #gemini #gpt #qwen #optuna #claude #mobilenet




