Avi Chawla (@_avichawla)

Mistral이 ElevenLabs의 대안이 될 수 있는 오픈웨이트 TTS 모델 Voxtral을 공개했다. 4B 파라미터, 70ms 지연시간, 3초 음성으로 보이스 클로닝, 9개 언어 지원과 크로스링구얼 전이 기능을 제공하며, Hugging Face에 오픈웨이트로 배포됐다.

https://x.com/_avichawla/status/2042145620178387432

#mistral #tts #voicecloning #huggingface #openweights

Avi Chawla (@_avichawla) on X

An open-weight alternative to ElevenLabs! Voxtral is a TTS model by Mistral with: - just 4B params - 70ms latency for voice agents - voice cloning from 3s of audio - 9 languages + cross-lingual transfer - 68.4% win rate over ElevenLabs Flash v2.5 Open weights on Hugging Face.

X (formerly Twitter)