FlashLabs’ Chroma 1.0 is a streaming speech to speech model that keeps your voice identity across multi-turn conversations while responding faster than real time.
#Chroma #FlashLabs #FOSS

FlashLabs ra mắt Chroma 1.0 - mô hình hội thoại giọng nói thời gian thực 4 tỷ tham số, hỗ trợ sao chép giọng nói cá nhân hóa. Công nghệ tiên tiến cho phép tương tác tự nhiên, mượt mà như người thật. #AI #SpeechModel #Chroma1.0 #VoiceCloning #TríTuệNhânTạo #CôngNghệ #FlashLabs

https://www.reddit.com/r/LocalLLaMA/comments/1qkvccs/flashlabs_researchers_release_chroma_10_a_4b_real/

🚀 Ba mô hình TTS mới nổi bật: 1️⃣ NVIDIA PersonaPlex‑7B‑v1 (7B tham số, speech‑to‑speech real‑time, tùy chỉnh giọng bằng prompt). 2️⃣ Inworld TTS‑1.5 (latency <250 ms, 15 ngôn ngữ, chi phí 0.5¢/phút, hỗ trợ sao chép giọng). 3️⃣ FlashLabs Chroma 1.0 (4B tham số, end‑to‑end real‑time <150 ms, mã nguồn mở). #TTS #AI #NVIDIA #Inworld #FlashLabs #SpeechSynthesis #CôngNghệ #TríTuệNhânTạo

https://www.reddit.com/r/singularity/comments/1qjxtqe/al_audio_3_major_tts_models_released_full_details/

Rohan Paul (@rohanpaul_ai)

FlashLabs(@flashlabsdotai)가 오픈소스 네이티브 음성→음성 모델 'Chroma'를 공개했습니다. Chroma는 오디오 토큰을 직접 처리해 기존의 ASR→LLM→TTS 분리 파이프라인 없이 한 루프에서 음성으로 추론하고 발화하며, 듀얼-레이어 RAG로 구동된다고 합니다. 자율 음성 에이전트와 실시간 음성 처리에 중요한 진전입니다.

https://x.com/rohanpaul_ai/status/2013999190058369044

#speechtospeech #opensource #audiollm #rag #flashlabs

Rohan Paul (@rohanpaul_ai) on X

Another great news for autonomous voice agents @flashlabsdotai launched Chroma, an open source native speech-to-speech model that processes audio tokens directly, so there is no ASR to LLM to TTS handoff. It reasons and speaks in audio in one loop. Powered by a dual-layer RAG

X (formerly Twitter)