На входе аудио, на выходе — саммари. Собираем локальный транскрибатор из бесплатного софта
Однажды я устал расшифровывать аудио пачкой инструментов в духе «Балерино-Капучино и Бобрито-Бандито» и решил собрать свой пайплайн. В статье расскажу, как я подключил ИИ к обработке голосовых записей буквально за вечер. Мне нужно было загружать запись голоса в нейросетку и на выходе получать выжимку с итогами встречи — саммари/фоллоу‑апами/«минутками». Я хотел от софта безопасности данных, локального запуска и минимума вложений (в идеале 0 затрат). Я системный аналитик, поэтому не был готов писать приложение целиком. По моей инструкции вы сможете сделать подобный конвейер своими силами даже без навыков кодинга.
https://habr.com/ru/companies/alfa/articles/909498/
#whisper #nemo #ollama #gemma #obsidian #транскрибация #диаризация #саммари #саммаризация #расшифровка_аудио