FlashLabs ra mắt Chroma 1.0 - mô hình hội thoại giọng nói thời gian thực 4 tỷ tham số, hỗ trợ sao chép giọng nói cá nhân hóa. Công nghệ tiên tiến cho phép tương tác tự nhiên, mượt mà như người thật. #AI #SpeechModel #Chroma1.0 #VoiceCloning #TríTuệNhânTạo #CôngNghệ #FlashLabs

https://www.reddit.com/r/LocalLLaMA/comments/1qkvccs/flashlabs_researchers_release_chroma_10_a_4b_real/

NVIDIA ra mắt PersonaPlex – mô hình hội thoại thời gian thực với điều khiển giọng nói và vai trò. Hỗ trợ tương tác tự nhiên như ngắt lời, xen ngang, phát hiện giọng nói liên tục và phản hồi mượt mà. Được điều kiện bởi giọng nói mẫu và hướng dẫn văn bản để định hình tính cách, vai trò. Khả dụng mã nguồn, trọng số và bản demo. #AI #SpeechModel #NVIDIA #PersonaPlex #TríTuệNhânTạo #MôHìnhGiọngNói #HộiThoạiTươngTác

https://www.reddit.com/r/singularity/comments/1qjusta/personaplex_voice_and_role_cont

VOSK Models

Accurate speech recognition for Android, iOS, Raspberry Pi and servers with Python, Java, C#, Swift and Node.

VOSK Offline Speech Recognition API