ТОП-5 нейросетей для транскрибации аудио в текст (часть 1)
Сегодня нас не удивишь тем, что нейросеть за пару секунд расшифровывает двухчасовую лекцию или превращает аудиозаметку в аккуратный текст с заголовками и абзацами. Мы живём в эпоху, где слова больше не нужно набирать вручную — достаточно просто их произнести. Остальное — за алгоритмами. Одно дело — стерильное студийное аудио, где диктор звучит как утренний ведущий на радио. Совсем другое — голосовое, записанное на фоне вентилятора и междометий в стиле «эээ… ну короче». Так что мы решили не просто составить список транскрибаторов с сухими характеристиками. Мы пошли дальше — устроили испытание! Взяли 5 популярных нейросетей и заставили их пройти 3 уровня сложности. Обзор вышел объёмным, поэтому мы разбили его на две части . В первой расскажем про три сервиса. Во второй — про оставшиеся два, а ещё попробуем выбрать лучших. Приятного Вам прочтения!
https://habr.com/ru/companies/bothub/articles/908672/
#нейросети #расшифровка_аудио #транскрибация #assemblyai #riverside #teamlogs