От MVP на Whisper до собственной ASR: как мы построили платформу субтитров для RUTUBE

Автоматическое создание субтитров для пользовательского контента может выглядеть довольно простой задачей: берем готовую ASR‑модель, распознаем аудио из видео и сохраняем результат. Именно таким и был наш первый MVP в RUTUBE — сервис на базе Whisper, который позволил быстро проверить гипотезу и запустить субтитры в production. Но очень быстро стало понятно, что между «распознать речь» и «сделать субтитры для всего контента» лежит огромный пласт работы. Миллионы новых видео, ролики длиной до 24 часов, неизвестный язык, шумный пользовательский контент, требования к качеству текста и жесткие ограничения по скорости обработки — всё это превратило задачу из простого ASR в полноценную платформу с микросервисной архитектурой и собственной системой распознавания речи. В статье расскажу, почему Whisper не подошел для production, как мы перестроили всю архитектуру и за счет чего смогли выйти на производительность около 1200 видео в час на один ASR.

https://habr.com/ru/companies/habr_rutube/articles/1028476/

#asr #whisper #распознавание_речи #highload #субтитры #production_ml #machine_learning

От MVP на Whisper до собственной ASR: как мы построили платформу субтитров для RUTUBE

Автоматическое создание субтитров для пользовательского контента может выглядеть довольно простой задачей: берем готовую ASR‑модель, распознаем аудио из видео и сохраняем результат. Именно...

Хабр

Как вырасти в ML? Что меняется, когда повышается ответственность

Про рост в ML часто говорят как про набор навыков: продакшен, инфраструктура, MLOps, ещё несколько технологий. Кажется, этого достаточно для следующего шага в карьере. Но на практике важнее не стек, а подход: как вы влияете на продукт, качество и надёжность ML-систем . В историях выпускников курса «Практическая ML-инженерия» разбираем: — Почему для Senior AI Engineer одного backend-опыта мало — Как перестать быть «человеком с ноутбуком» и начать влиять на продукт — Чем ML/AI полезны тимлиду по автоматизации (RPA + AI) в США?

https://habr.com/ru/articles/1006902/

#рост_в_ML #ML_engineer #MLOps #production_ML #ML_pipeline #разработка_MLсервисов #карьерный_рост_в_Data_Science #архитектура_ML_систем #жизненный_цикл_ML_продукта

Как вырасти в ML? Что меняется, когда повышается ответственность

Про рост в ML часто говорят как про набор навыков: продакшен, инфраструктура, MLOps, ещё несколько технологий. Кажется, этого достаточно для следующего шага в карьере. Но на практике важнее не стек, а...

Хабр