#Chroma #FlashLabs #FOSS
FlashLabs ra mắt Chroma 1.0 - mô hình hội thoại giọng nói thời gian thực 4 tỷ tham số, hỗ trợ sao chép giọng nói cá nhân hóa. Công nghệ tiên tiến cho phép tương tác tự nhiên, mượt mà như người thật. #AI #SpeechModel #Chroma1.0 #VoiceCloning #TríTuệNhânTạo #CôngNghệ #FlashLabs
🚀 Ba mô hình TTS mới nổi bật: 1️⃣ NVIDIA PersonaPlex‑7B‑v1 (7B tham số, speech‑to‑speech real‑time, tùy chỉnh giọng bằng prompt). 2️⃣ Inworld TTS‑1.5 (latency <250 ms, 15 ngôn ngữ, chi phí 0.5¢/phút, hỗ trợ sao chép giọng). 3️⃣ FlashLabs Chroma 1.0 (4B tham số, end‑to‑end real‑time <150 ms, mã nguồn mở). #TTS #AI #NVIDIA #Inworld #FlashLabs #SpeechSynthesis #CôngNghệ #TríTuệNhânTạo
Rohan Paul (@rohanpaul_ai)
FlashLabs(@flashlabsdotai)가 오픈소스 네이티브 음성→음성 모델 'Chroma'를 공개했습니다. Chroma는 오디오 토큰을 직접 처리해 기존의 ASR→LLM→TTS 분리 파이프라인 없이 한 루프에서 음성으로 추론하고 발화하며, 듀얼-레이어 RAG로 구동된다고 합니다. 자율 음성 에이전트와 실시간 음성 처리에 중요한 진전입니다.

Another great news for autonomous voice agents @flashlabsdotai launched Chroma, an open source native speech-to-speech model that processes audio tokens directly, so there is no ASR to LLM to TTS handoff. It reasons and speaks in audio in one loop. Powered by a dual-layer RAG