Computer Vision модель в борьбе с галлюцинациями LLM. Оправданный оверинжиниринг?
Проект PhotoMentor создавался как ИИ-ментор для фотографов. Механика простая: пользователь загружает снимок, а под капотом Gemini выступает в роли арт-директора — анализирует композицию, работу со светом, цветовую гармонию и выдает детальный фидбек с оценкой. С главной проблемой Vision-моделей я столкнулся в первый же день закрытых тестов. Я скормил Gemini свой тестовый снимок: крупный портрет собаки, положившей морду на лапы. Модель уверенно выдала:
https://habr.com/ru/articles/1007788/
#иимодель #фотография #computervision #yolo #gemini_ai #python #vibecoding #hallucinationsinai

