Voicebox는 완전 로컬에서 구동되는 오픈소스 AI 보이스 스튜디오로 ElevenLabs·WisprFlow의 무료 대안입니다. 몇 초 샘플로 목소리 클론, 다중 TTS 엔진, Whisper 기반 전사·정제, 타임라인 에디터·오디오 이펙트, Metal/CUDA/ROCm/DirectML/Intel Arc 등 로컬 GPU 지원을 제공합니다. REST API와 MCP 연동으로 에이전트에 클론 음성을 부여하고 API키·요금 없이 오프라인 사용이 가능합니다.






