Mô hình TTS mã nguồn mở Sopro (169M tham số) vừa ra mắt! Sopro hỗ trợ chuyển văn bản thành giọng nói thời gian thực và nhân bản giọng nói zero-shot (chỉ cần 3-12s mẫu). Dù chỉ hỗ trợ tiếng Anh và chưa phải SOTA, mô hình đạt tốc độ nhanh 0.25 RTF trên CPU, giúp tạo 30s audio chỉ trong 7.5s.

#Sopro #TTS #AI #ZeroShot #VoiceCloning #MãNguồnMở #TríTuệNhânTạo #CôngNghệ

https://www.reddit.com/r/LocalLLaMA/comments/1q6sp4b/sopro_a_169m_parameter_realtime_tts_model_with/

@null oh TIL that's format for ProRAW 🤔 #SoPro