Как утки с СДВГ довели меня до опенсорса: зачем я собрал утилиту для перевода коротких видео на домашней видеокарте

Всем привет! Листал ленту тиктока и попался американский ролик про СДВГ, где всё объясняют на утках. Понравилось. И я подумал: классно было бы сделать такой же тикток, только на русском. Но я ленивый. Снимать, писать сценарии, делать всё с нуля - это скучно. А вот взять готовый ролик и перевести-переозвучить его на русский - вот это уже интересно, подумал я, а потом задумался, о том, как это автоматизировать. Это оказалось интересной инженерной задачей, которая увлекла меня на неделю времени, и привела к созданию ИИ утилиты с открытым исходным кодом. А тикток с утками я так и не создал...

https://habr.com/ru/articles/1051580/

#Dub_Studio #дубляж_видео #перевод_видео #локальные_нейросети #TTS #клонирование_голоса #ASR #Gemma #Qwen3TTS #open_source

Как утки с СДВГ довели меня до опенсорса: зачем я собрал утилиту для перевода коротких видео на домашней видеокарте

Dub Studio - локальная утилита для перевода коротких роликов. Та самая утка тоже тут. Всем привет! Листал ленту тиктока и попался американский ролик про СДВГ, где всё объясняют на утках. Понравилось....

Хабр

Погружаем модели в сказки русские, да рассказы древние – тестируем возможности Qwen и Whisper на дореволюционномъ

Хотите не забывать детали диалога или то, что вас просили купить в магазине? Конечно, можно по старинке открывать блокнот в телефоне или чат в избранном и записывать все руками, но в потоке задач это неудобно. Гораздо проще надиктовать мысли голосом или записать разговор, а расшифровку доверить сервису. Сегодня ASR-системы нового поколения способны учитывать контекст беседы и выдавать осмысленный текст. Однако у любой медали есть обратная сторона — архитектурные ограничения. Чтобы понять, готовы ли эти модели к жизненным сценариям, мы устроили им бенчмарк на Hugging Face. Ниже — разбор того, ломается ли контекстное окно алгоритмов на длинных видеозаписях и как фоновый шум влияет на итоговое качество транскрибации.

https://habr.com/ru/companies/selectel/articles/1050826/

#selectel #распознавание_речи #whisper #qwen #asr #транскрибация_речи #автоматическое_распознавание_речи #искусственный_интеллект #тестирование_моделей

Погружаем модели в сказки русские, да рассказы древние – тестируем возможности Qwen и Whisper на дореволюционномъ

Хотите не забывать детали диалога или то, что вас просили купить в магазине? Конечно, можно по старинке открывать блокнот в телефоне или чат в избранном и записывать все руками, но в потоке задач это...

Хабр

📰 Calciomercato Roma: in arrivo le offerte di Arsenal e Chelsea per Konè. I Blues pronti a spingersi fino a 50 milioni

#️⃣ #Calciomercato #Ultima #asroma #ASR #asromanews #dajeroma #thelabsocial @altbot

🔗 https://www.giallorossi.net/calciomercato-roma-in-arrivo-le-offerte-per-kone-il-chelsea-pronto-a-spingersi-fino-a-50-milioni/

Погружаем модели в сказки русские, да рассказы древние – тестируем возможности Qwen и Whisper на дореволюционномъ

Хотите не забывать детали диалога или то, что вас просили купить в магазине? Конечно, можно по старинке открывать блокнот в телефоне или чат в избранном и записывать все руками, но в потоке задач это неудобно. Гораздо проще надиктовать мысли голосом или записать разговор, а расшифровку доверить сервису. Сегодня ASR-системы нового поколения способны учитывать контекст беседы и выдавать осмысленный текст. Однако у любой медали есть обратная сторона — архитектурные ограничения. Чтобы понять, готовы ли эти модели к жизненным сценариям, мы устроили им бенчмарк на Hugging Face. Ниже — разбор того, ломается ли контекстное окно алгоритмов на длинных видеозаписях и как фоновый шум влияет на итоговое качество транскрибации.

https://habr.com/ru/companies/selectel/articles/1050826/

#selectel #распознавание_речи #whisper #qwen #asr #транскрибация_речи #автоматическое_распознавание_речи #искусственный_интеллект #тестирование_моделей

Погружаем модели в сказки русские, да рассказы древние – тестируем возможности Qwen и Whisper на дореволюционномъ

Хотите не забывать детали диалога или то, что вас просили купить в магазине? Конечно, можно по старинке открывать блокнот в телефоне или чат в избранном и записывать все руками, но в потоке задач это...

Хабр

📰 Greenwood, smentite sull’accordo col Fenerbahce. Roma sempre avanti, affare possibile dopo il 30 giugno

#️⃣ #Calciomercato #Ultima #asroma #ASR #asromanews #dajeroma #thelabsocial @altbot

🔗 https://www.giallorossi.net/greenwood-smentite-sullaccordo-col-fenerbahce-roma-sempre-avanti-affare-possibile-dopo-il-30-giugno/

📰 Calciomercato Roma, dalla Spagna: Barcellona su El Aynaoui, D’Amico chiede 30 milioni

#️⃣ #Calciomercato #Inrilievo #asroma #ASR #asromanews #dajeroma #thelabsocial @altbot

🔗 https://www.giallorossi.net/calciomercato-roma-dalla-spagna-barcellona-su-el-aynaoui-damico-chiede-30-milioni/

Roma, D’Amico stringe sui rinnovi: Dybala e Celik in dirittura, poi il sì di Pellegrini

Gli agenti saranno invitati a Trigoria. Il club taglia e prolunga. L'argentino rinuncerà al 65% dell'ingaggio