Компьютерное зрение на C++: пишем приложение для поиска объектов под Android
Привет, Хабр! Меня зовут Кирилл Колодяжный, я пишу код на С++ для систем хранения данных в YADRO. Помимо основной работы, интересуюсь машинным обучением и его возможностями, в том числе на «плюсах». Недавно мне стало интересно разобраться, как развернуть модель компьютерного зрения на мобильном устройстве с операционной системой Android. Я изучил доступные инструменты, чтобы понять, какие части приложения можно реализовать на С++, и написать само приложение для телефона. Ни в одном из материалов на подобную тему не описывают реализацию такого приложения от начала до конца, поэтому я собрал свой опыт в серию статей. Расскажу, как реализовать обнаружение объектов в реальном времени с помощью камеры на мобильной платформе Android с использованием библиотек PyTorch и NCNN и моделей компьютерного зрения YOLOv5 и YOLOv4. Шаблон моего приложения пригодится тем, кто хочет проверить прототип функциональности для компьютерного зрения на С++, использующий OpenCV на Android, но не хочет глубоко погружаться в программирование под Android. В первой части цикла мы: • создадим проект в IDE Android Studio, • реализуем сессию непрерывного захвата изображений камеры, • преобразуем изображения в матрицу OpenCV, чтобы сделать дальнейшую работу удобной.
https://habr.com/ru/companies/yadro/articles/850786/
#ml #cpp #computer_vision #android #pytorch #opencv #ncnn #yolov5 #yolov4 #torchscript
