Linoy Tsaban (@linoy_tsaban)

KugelAudio는 오픈소스 TTS 모델로 소개되며, Vibe-Voice 7B를 파인튜닝하여 제작되었고 약 20만 시간 분량의 데이터로 23개 언어를 학습해 최첨단(SOTA) 성능을 냈다고 알립니다. 더 많은 주목을 받아야 한다는 추천이 포함된 공개 모델 소식입니다.

https://x.com/linoy_tsaban/status/2020891254889095328

#tts #opensource #speech #vibevoice #kugelaudio

Linoy Tsaban (@linoy_tsaban) on X

ICYMI: KugelAudio is an open source TTS model that should get way more attention > fine-tuned from Vibe-Voice 7B > trained on 200K hours of 23 Languages > state-of-the-art performance 🔥

X (formerly Twitter)