Как утки с СДВГ довели меня до опенсорса: зачем я собрал утилиту для перевода коротких видео на домашней видеокарте

Всем привет! Листал ленту тиктока и попался американский ролик про СДВГ, где всё объясняют на утках. Понравилось. И я подумал: классно было бы сделать такой же тикток, только на русском. Но я ленивый. Снимать, писать сценарии, делать всё с нуля - это скучно. А вот взять готовый ролик и перевести-переозвучить его на русский - вот это уже интересно, подумал я, а потом задумался, о том, как это автоматизировать. Это оказалось интересной инженерной задачей, которая увлекла меня на неделю времени, и привела к созданию ИИ утилиты с открытым исходным кодом. А тикток с утками я так и не создал...

https://habr.com/ru/articles/1051580/

#Dub_Studio #дубляж_видео #перевод_видео #локальные_нейросети #TTS #клонирование_голоса #ASR #Gemma #Qwen3TTS #open_source

Как утки с СДВГ довели меня до опенсорса: зачем я собрал утилиту для перевода коротких видео на домашней видеокарте

Dub Studio - локальная утилита для перевода коротких роликов. Та самая утка тоже тут. Всем привет! Листал ленту тиктока и попался американский ролик про СДВГ, где всё объясняют на утках. Понравилось....

Хабр

能在CPU上运行的tts模型对比,supertonic 3结合了速度和质量,但是我依旧选择Kokoro。tts服务和stt服务,支持cpu很关键啊,自己搭建到vps上,使用的时候生成一段,或音频,或字幕,很方便。

Kokoro 82M vs Supertonic 3 vs Inflect-Nano-v1: A Real CPU TTS Benchmark

https://heyneo.com/blog/kokoro-supertonic-inflect-nano-cpu-tts-benchmark

#tts #kokoro #supertonic

YouTubers before 2023: spend hours, days, weeks, months making a video!

YouTubers after 2023: AI generate that $h*t and claim it's your work!

#aislop #genai #ai #artificialintelligence #youtux #youtube #openai #chatgpt #voiceengine #tts #stt

Как мы разрабатывали TTS для Ил-2 Штурмовик

Так получилось, что нам посчастливилось принять участие в разработке синтеза для новой версии игры "Ил-2 Штурмовик". Это был длинный путь, но в итоге у нас получилось: Что получилось?

https://habr.com/ru/articles/1050432/

#ил2 #tts #синтез #силеро #silero #ил2_штурмовик #озвучка #русский #английский #китайский

Как мы разрабатывали TTS для Ил-2 Штурмовик

Все же помнят легенду? Так получилось, что нам посчастливилось принять участие в разработке синтеза для новой версии игры игры Ил-2 Штурмовик — Ил-2: Корея. Это был длинный путь, но в итоге у нас...

Хабр

To make it easier to discover the Luxembourgish voices Mil and Mia for screen readers, we've included a short demonstration in their dedicated article on accessibilite.public.lu. You can type your text in Luxembourgish and listen to the audio without needing to install anything on your computer or phone.

https://accessibilite.public.lu/en/news/2026-03-30-screenreaderLB.html

#a11y #tts #screenReader

@WeirdWriter yeah, cuz even the shittiest #TTS is less morally wrong.
VoxCPM2.0整合包升级,原生48kHz高质量音频,srt字幕配音,多角色配音,50系显卡,8G显存,TTS音色克隆,AI配音和indextts2一样优秀!

YouTube

Что перестаёт работать в тестировании, когда приходит LLM

13 лет я тестировала софт, где у бага был адрес: шаг 1, шаг 2, ожидаемый результат, фактический. Нажал — получил. Нажал ещё раз — получил то же самое. А пару лет назад я начала тестировать продукты на LLM. И почти всё, на чём держится классический QA, перестало работать. Не «усложнилось» — перестало работать как метод. Ниже — где именно ломается, по пунктам. Если вы тестировщик и заходите в AI, это ваша новая реальность.

https://habr.com/ru/articles/1049482/

#llm #qa #qa_lead #aiагенты #stt #tts #chatbot #evals #llm_testing

Что перестаёт работать в тестировании, когда приходит LLM

Слева — привычный зелёный тест. Справа — то, что с ним делает LLM 13 лет я тестировала софт, где у бага был адрес: шаг 1, шаг 2, ожидаемый результат, фактический. Нажал — получил. Нажал ещё раз —...

Хабр

Une très belle édition de Voxxed Days Luxembourg, au cours de laquelle nous avons eu l'opportunité de présenter avec @dnauroy notre projet de voix luxembourgeoises utilisables par les personnes aveugles et malvoyantes dans les lecteurs d'écrans.
Un grand merci aux organisateurs et aux participants pour les échanges très intéressants !

Pour en savoir plus sur le projet :
https://accessibilite.public.lu/fr/news/2026-03-30-screenreaderLB.html

#voxxed_lu #voxxedDaysLuxembourg #a11y #accessibility #tts #luxembourgish #luxembourg #RHvoice

GitHub - OpenMOSS/MOSS-TTS: MOSS‑TTS Family is an open‑source speech and sound generation model family from MOSI.AI and the OpenMOSS team. It is designed for high‑fidelity, high‑expressiveness, and complex real‑world scenarios, covering stable long‑form speech, multi‑speaker dialogue, voice/character design, environmental sound effects, and real‑time streaming TTS.

MOSS‑TTS Family is an open‑source speech and sound generation model family from MOSI.AI and the OpenMOSS team. It is designed for high‑fidelity, high‑expressiveness, and complex real‑world scenario...

GitHub