Multi-API Ensemble: 95% точности транскрипции региональных топонимов
В статье полный разбор архитектуры, алгоритмы scoring, примеры кода и расчёт экономики. Один STT-сервис дал 60-70% точности на специфической лексике (топонимы, названия улиц, профессиональные термины). Два сервиса параллельно + взвешенное голосование + AI-fusion для спорных случаев дали 95%+ точности. Время обработки 5-8 секунд.
https://habr.com/ru/articles/974978/
#speechtotext #whisper #gemini #salutespeech #транскрипция #распознавание_речи #сезон_ии_в_разработке #ensemble #python #asyncio
