金のニワトリ (@gosrum)

Gemma 4 E4B의 오디오 입력 기능을 이용해 음성 채팅 앱을 만들어 시험해 본 사례가 공유됐다. 음성 인식 전사 정확도는 좋았지만, 실제로 자연스러운 대화가 되는지는 아직 아쉬움이 있다고 평가해, 멀티모달 음성 AI 기능의 초기 활용 가능성을 보여준다.

https://x.com/gosrum/status/2043526347876933714

#gemma #voice_chat #audio_input #multimodal_ai #speech_recognition

金のニワトリ (@gosrum) on X

gemma4-E4Bのオーディオ入力機能を使った音声チャットアプリを作ってみたのでお試し ※途中音が出ます 【備忘録メモ】 ・文字起こしの精度は良い ・gemma4-E4B自体がそこまで賢くないためか、正しく意思疎通ができているかというと微妙なところ

X (formerly Twitter)

구글, 파라미터당 지능 극대화한 오픈 모델 Gemma 4 출시

Gemma 4는 Gemini 3의 연구 기술을 기반으로 설계되어 파라미터당 지능(Intelligence-per-parameter)을 극대화한 구글의 차세대 오픈 모델 시리즈다.

🔗 원문 보기

구글, 파라미터당 지능 극대화한 오픈 모델 Gemma 4 출시

Gemma 4는 Gemini 3의 연구 기술을 기반으로 설계되어 파라미터당 지능(Intelligence-per-parameter)을 극대화한 구글의 차세대 오픈 모델 시리즈다.

Ruby-News | 루비 AI 뉴스