Large-v3 на Ryzen 5500U: как я оцифровал архив диктофонных записей без GPU и облаков
Как превратить обычный ноутбук в автономную станцию расшифровки, если у вас нет мощной GPU, а облака не подходят по цене или приватности? В статье делюсь опытом создания локального конвейера на базе WhisperX для обработки сотен часов аудиоархива. О чем пойдет речь: Large-v3 на CPU : почему 40 ГБ RAM важнее видеокарты и как добиться стабильной работы без «замерзания» PyTorch. От скрипта к приложению : как с помощью «вайб-кодинга» и Google Antigravity (Gemini 3.0) превратить одиночный скрипт в модульный менеджер очередей с Drag-and-Drop и пакетной обработкой. Техническое «мясо» : установка через uv в один клик, борьба с конфликтами OpenMP и система пресетов (от Turbo до Russian Expert). Реальные цифры : нагрузка на железо, температуры и честная скорость обработки на Ryzen 5500U. Разбираем, как современные LLM позволяют собирать сложные инженерные инструменты «над» ML-моделями, даже не погружаясь в их низкоуровневую реализацию. Репозиторий проекта : whisperx-batch-gui
https://habr.com/ru/articles/1003200/
#WhisperX #Python #Транскрибация #Искусственный_интеллект #Машинное_обучение #LLM #Gradio #Open_Source #Автоматизация #Ryzen









