Avi Chawla (@_avichawla)
Mistral이 ElevenLabs의 대안이 될 수 있는 오픈웨이트 TTS 모델 Voxtral을 공개했다. 4B 파라미터, 70ms 지연시간, 3초 음성으로 보이스 클로닝, 9개 언어 지원과 크로스링구얼 전이 기능을 제공하며, Hugging Face에 오픈웨이트로 배포됐다.

Avi Chawla (@_avichawla) on X
An open-weight alternative to ElevenLabs! Voxtral is a TTS model by Mistral with: - just 4B params - 70ms latency for voice agents - voice cloning from 3s of audio - 9 languages + cross-lingual transfer - 68.4% win rate over ElevenLabs Flash v2.5 Open weights on Hugging Face.