AA (@measure_plan)
Gemma 4의 비전 기능을 활용해 Roboflow RF-DETR로 객체를 먼저 탐지하고, Gemma가 장면을 한 문장으로 요약하는 앱을 만들어 실험했습니다. 객체 인식과 멀티모달 요약을 결합한 실용적 AI 응용 사례입니다.

AA (@measure_plan) on X
i spent the afternoon experimenting with Gemma 4's vision capabilities made an app that uses roboflow RF-DETR for a first pass of object detections and Gemma to summarize the scene in one sentence for fun i asked Gemma to "describe what you see as if you were a medieval bard"