Как утки с СДВГ довели меня до опенсорса: зачем я собрал утилиту для перевода коротких видео на домашней видеокарте

Всем привет! Листал ленту тиктока и попался американский ролик про СДВГ, где всё объясняют на утках. Понравилось. И я подумал: классно было бы сделать такой же тикток, только на русском. Но я ленивый. Снимать, писать сценарии, делать всё с нуля - это скучно. А вот взять готовый ролик и перевести-переозвучить его на русский - вот это уже интересно, подумал я, а потом задумался, о том, как это автоматизировать. Это оказалось интересной инженерной задачей, которая увлекла меня на неделю времени, и привела к созданию ИИ утилиты с открытым исходным кодом. А тикток с утками я так и не создал...

https://habr.com/ru/articles/1051580/

#Dub_Studio #дубляж_видео #перевод_видео #локальные_нейросети #TTS #клонирование_голоса #ASR #Gemma #Qwen3TTS #open_source

Как утки с СДВГ довели меня до опенсорса: зачем я собрал утилиту для перевода коротких видео на домашней видеокарте

Dub Studio - локальная утилита для перевода коротких роликов. Та самая утка тоже тут. Всем привет! Листал ленту тиктока и попался американский ролик про СДВГ, где всё объясняют на утках. Понравилось....

Хабр

Qwen3-TTS, 3초 클립으로 목소리를 복제하는 오픈소스 TTS

Alibaba Qwen 팀의 Qwen3-TTS, 3초 음성 샘플로 목소리 복제하고 97ms 만에 첫 응답을 생성하는 초저지연 멀티링구얼 TTS 모델을 소개합니다.

https://aisparkup.com/posts/8918

就中英混合的文字生成语音,还是vibevoice好,qwen3-tts这点上简直就是婴儿级别的,根本没法用。

#tts #vibevoice #qwentts #qwen #qwen3 #qwen3tts

Новые LLM из Китая, бесплатный аналог Suno, ИИ-собеседник от Nvidia и признание Альтмана о текстах в GPT

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий. Неделя выдалась насыщенной: куча мощнейших релизов из Китая, которые наступают на пятки GPT-5.2 и Gemini 3. Реалтайм инструменты от Krea и NVIDIA, генеративные модели от Qwen и Hunyuan, а Сэм Альтман честно признал, что OpenAI испортили тексты в последних версиях GPT. Всё самое важное — в одном месте. Поехали! Читать дайджест →

https://habr.com/ru/companies/timeweb/articles/990420/

#нейросети #ии #krea #qwen #qwen3tts #texttospeech #alibaba #baidu #ernie #timeweb_дайджест

Новые LLM из Китая, бесплатный аналог Suno, ИИ-собеседник от Nvidia и признание Альтмана о текстах в GPT

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.  Меня зовут Вандер , и каждую неделю я обозреваю новости о...

Хабр

Qwen3-TTS ra mắt với độ trễ siêu thấp chỉ 97ms, hỗ trợ nhân bản giọng nói và API tương thích OpenAI. Công nghệ tổng hợp giọng nói tiên tiến, lý tưởng cho ứng dụng thời gian thực. #Qwen3TTS #VoiceSynthesis #AI #TextToSpeech #TríTuệNhânTạo #TTS #OpenAI

https://www.reddit.com/r/ollama/comments/1qlzbwk/release_qwen3tts_ultralow_latency_97ms_voice/

Qwen3-TTS ra mắt với độ trễ cực thấp chỉ 97ms, hỗ trợ sao chép giọng nói từ đoạn âm thanh 3 giây, điều khiển cảm xúc bằng ngôn ngữ tự nhiên và tương thích API với OpenAI. Chạy local trên GPU, hỗ trợ 10+ ngôn ngữ. Dễ dàng tích hợp qua Docker và Python.
#Qwen3TTS #TextToSpeech #VoiceCloning #AI #MachineLearning #TTS #TríTuệNhânTạo #AIâmthanh #CôngNghệ #LocalAI

https://www.reddit.com/r/LocalLLaMA/comments/1qlzbhh/release_qwen3tts_ultralow_latency_97ms_voice/

1,7 Milliarden Parameter laufen jetzt lokal. Mit Qwen3-TTS veröffentlicht Alibaba Code und Gewichte für hochwertiges Voice Cloning. Die Transformer-Architektur ermöglicht Synthese ohne Cloud-Abhängigkeit und Datenschutzprobleme. Performance auf Consumer-Hardware ist gegeben, die Qualität konkurriert direkt mit geschlossenen Systemen. #Qwen3TTS #OpenSource #Alibaba
https://www.all-ai.de/news/news26/qwen-tts-neu
Qwen3-TTS: Neue Open-Source-KI klont Stimmen perfekt und kostenlos

Schluss mit teuren Abos: Alibaba veröffentlicht mächtiges Sprachmodell für den heimischen PC, das ElevenLabs ernsthaft herausfordert.

All-AI.de

Qwen3-TTS Family Is Now Open Sourced: Voice Design, Clone, and Generation

https://qwen.ai/blog?id=qwen3tts-0115

#HackerNews #Qwen3TTS #OpenSource #VoiceDesign #VoiceClone #VoiceGeneration

Qwen

Qwen Chat offers comprehensive functionality spanning chatbot, image and video understanding, image generation, document processing, web search integration, tool utilization, and artifacts.

If AI voices excite you, this one will blow your mind.

Qwen3-TTS-Flash just landed with 49 voices, 10 languages, real dialects, and a delivery that finally sounds human.

It gives creators, developers, and educators studio-grade audio without actors or pricey gear, and you can tap straight into it through the Qwen API.

I break down what makes it special, why these upgrades matter, and how to put it to work.

Qwen3-TTS just dropped and it’s wild. Voices that don’t just talk, they perform.

Have you tried it yet?
Read the full report here> https://qwen.ai/blog?id=qwen3-tts-1128&utm_source=alphasignal&utm_campaign=2025-12-08&lid=tScfCJ3Z2QRcPRrf

#datasciencenigeria #DSNResearchbuzz #Qwen3tts

Qwen3-TTS đã ra mắt! Đây là mô hình tổng hợp giọng nói (Text-to-Speech) mới, cho phép chuyển văn bản thành âm thanh. Hiện có bản demo để bạn trải nghiệm.
#Qwen3TTS #TTS #AI #TextToSpeech #CôngNghệ #TríTuệNhânTạo

https://www.reddit.com/r/LocalLLaMA/comments/1pfiar0/qwen3tts/