金のニワトリ (@gosrum)
Gemma 4 E4B의 오디오 입력 기능을 이용해 음성 채팅 앱을 만들어 시험해 본 사례가 공유됐다. 음성 인식 전사 정확도는 좋았지만, 실제로 자연스러운 대화가 되는지는 아직 아쉬움이 있다고 평가해, 멀티모달 음성 AI 기능의 초기 활용 가능성을 보여준다.
https://x.com/gosrum/status/2043526347876933714
#gemma #voice_chat #audio_input #multimodal_ai #speech_recognition

