On-Device Real-Time Speech-to-Speech Translation [video]
Picovoice가 Windows PC에서 완전 온디바이스 방식으로 실시간 음성-음성 번역을 시연했다. NASA Artemis II 방송을 영어에서 프랑스어로 실시간 변환하며, STT, 기계 번역, TTS 전 과정을 클라우드 없이 로컬에서 처리한다. 주요 구성요소는 Cheetah Streaming Speech-to-Text, Zebra Translate, Orca Streaming Text-to-Speech이며, 11세대 인텔 i7 CPU에서 14% CPU 사용률로 동작한다. 오픈소스 데모 코드도 공개되어 AI 음성 번역 에이전트 개발에 참고할 수 있다.
https://www.youtube.com/watch?v=D9id2Dgv_OM
#speechtospeech #ondevice #realtimetranslation #picovoice #stt






