Все переводчики речи в реальном времени — херня. Я написал свой. Тоже херня, но бесплатная

Перепробовал всё что есть на рынке, потратил на подписки больше чем на кофе, и в итоге сел писать с нуля. Вот что вышло AI Open Source Voice AI Real-time перевод Deepgram Groq Piper TTS STT TTS LLM Google Meet Zoom Личный опыт Elixir Rust macOS Apple Silicon Speech-to-Text Text-to-Speech Сижу на рабочем созвоне. Обсуждаем архитектуру нового сервиса. Технически я всё понимаю - документацию на английском читаю без словаря, код ревьюю, в Slack переписываюсь нормально. А вот когда надо открыть рот и сказать что-то сложнее "I agree" - начинается цирк. Пауза. Подбираю слова. Коллега уже ответил за меня. Знакомо? Мне - до зубного скрежета. Я CTO, последние годы плотно работаю с AI-интеграциями. Могу собрать систему автоматического обзвона клиентов с клонированием голосов, поднять флот ботов для скана Телеги, собрать архитектуру которая выдержит тысячи пользователей за копейки. А сам на созвоне звучу как иностранец с разговорником. Ирония уровня бог. И вот в голове простая картинка: я говорю по-русски, собеседник слышит английский. Он отвечает по-английски, я слышу русский. В реальном времени. Без пауз на 10 секунд. Без субтитров - именно голосом. С любым приложением: Meet, Zoom, Slack, Discord. Пошёл искать. И тут началось.

https://habr.com/ru/articles/1019458/

#realtime_communications #translations #speechtotext #texttospeech #deepgram #groq #elixir #rust #open_source #voice_ai

Все переводчики речи в реальном времени — херня. Я написал свой. Тоже херня, но бесплатная

Перепробовал всё что есть на рынке, потратил на подписки больше чем на кофе, и в итоге сел писать с нуля. Вот что вышло AI Open Source Voice AI Real-time перевод Deepgram Groq Piper TTS STT TTS LLM...

Хабр

Deepgram triples default concurrency limits as voice agents quietly move from pilot to production

https://fed.brid.gy/r/https://nerds.xyz/2026/02/deepgram-triples-default-concurrency-limits/

Using #GoogleGemini3 and #deepgram Nova 3 model in #Superwhisper, I could get pretty decent Bengali to English transliteration done.

My family on Whatsapp generally converse in Bengali on voice, but on chat it is generally transliterated Bengali because most cannot read the script. But manual transliteration can get hairy, and annoying on mobile for large blocks of text.

#AI #transcription

GameCap – Enfin des sous-titres traduits en temps réel pour vos jeux vidéo

https://fed.brid.gy/r/https://korben.info/gamecap-sous-titres-traduction-jeux-video-ia.html

ElevenLabs macht 330 Millionen Dollar ARR. Parallel sichert sich Deepgram 130 Millionen Dollar Funding bei einer Bewertung von 1,3 Milliarden. Das Geld fließt sofort in die Übernahme eines YC-Startups zur Stärkung der Sprachinfrastruktur. Der Fokus verschiebt sich damit von technischen Demos hin zu profitablen Geschäftsmodellen. Ist Voice die einzig logische Skalierung für LLM-Inputs? #ElevenLabs #Deepgram #VoiceAI
https://www.all-ai.de/news/news26top/elevenlabs-deepgram-voice
ElevenLabs & Deepgram: Die neuen Giganten der Audio-KI

Mit 330 Millionen Dollar Umsatz und neuer Einhorn-Bewertung definieren diese Startups die Zukunft der Sprachsteuerung.

All-AI.de
🎤 Create custom voice agents in under 10 minutes using #Python with STT, LLM and TTS pipelines like #Deepgram, #OpenAI GPT-4o and #Cartesia Sonic. Supports realtime speech-to-speech with models like OpenAI Realtime API for lifelike conversations. Multilingual semantic turn detection in 13 languages including English, German and Spanish with <25ms latency on CPU. Automatic interruption handling and VAD for natural turn-taking outperforms platforms like #Vapi. 📚 https://docs.livekit.io
Voice AI quickstart | LiveKit Docs

Build and deploy a simple voice assistant in less than 10 minutes.

LiveKit Docs
Kudos to #Deepgram for their fantastic transcription quality and generous free tier 💸 They make these little experiments accessible to everyone 🙌
🚀 Part 5: The Future of Healthcare AI!
🔹 EHR integration? ✅
🔹 Telemedicine-ready? ✅
🔹 Super fast & cost-effective? ✅
👥 Tag a healthcare pro who needs this!
Nova-3 Medical is a game-changer! 💡
#Deepgram #MedicalAI #SpeechToText #Tech #Nova-3 #HIPAA #AWS #AI #AWSBedrock
🔒 Part 4: Secure & Customizable!
🛡️ HIPAA-compliant, VPC-ready!
🎯 Train it with 100 medical terms!
💰 Costs just $0.0077/min – 2X cheaper!
🔥 Healthcare just got a transcription UPGRADE!
Next: Why Nova-3 is a MUST for startups! Part 5! 🚀
#Deepgram #HIPAA #Healthcare #AI
⚡ Part 3: Nova-3 Medical’s SHOCKING Accuracy!
📊 WER: 3.45% (63.6% better!) 🚀
📊 KER: 6.79% (40.35% better!) 🔍
⚡ Transcribes 5-40x faster!
💡 Perfect for EHRs & telemedicine!
Next: Customization & Security – Part 4 drops soon! 🔒
#AI #HealthTech #Deepgram #Tech #Nova-3 #AWS