Whisper hears Jinx trying to sneak up for another attack.
#whisper #whisperthewonderpuss #cats #northdakota #orangecats
war nicht das problem
ich denke auch #qwen war nicht das problem war - das llm hat hängt sich immer wieder bei sprachnachrichten auf!
#hermesAI #hermesagent zickt da anscheinend rum... ich hab zum wechsel audf das qat-modell nicht eine sprachnachricht und nicht einen loop gehabt
-> dann angefangen zu spielen - sprachis geschickt - das ding loopt! war bestimmt das gleiche problem mit qwen
da ich auf dem handy eh #whisper flow installiert habe - eh bessere noch mal über den prompt drüberlesen
Whisper hears Jinx trying to sneak up for another attack.
#whisper #whisperthewonderpuss #cats #northdakota #orangecats
Голосовой КПТ-дневник с распознаванием речи на устройстве: Flutter и on-device Whisper
Эта статья про то, как я сделал голосовой дневник мыслей для когнитивно-поведенческой терапии, почему распознавание речи у меня крутится прямо на телефоне, и какие на этом пути были технические развилки. Кода почти не будет, будет архитектура и обоснование решений. Я сам прошёл через тревожные расстройства, панические атаки и несколько депрессивных периодов. Из всего, что мне помогало, переломной стала КПТ, и у неё есть домашняя часть, дневник мыслей, который нужно вести между сессиями. Вести его текстом в момент тревоги у меня не получалось годами, и в какой-то момент я понял, что хочу диктовать его голосом. Так появился проект, который я тут и разбираю.
https://habr.com/ru/articles/1043432/
#Flutter #Whisper #whispercpp #ondevice #распознавание_речи #Dart #КПТ #мобильная_разработка
⚡️ Patch 0.80.18 for Heroes of Might and Magic: Olden Era by Unfrozen, a hefty balance and anti-cheat update. CHEATERS got slammed.
Expert sub-skills «Whisper of Elements» were reworked, «Summon Avatar» is now purely magical, passive «Parry» tweaked, and underperforming upgraded troops received buffs. The random-map generator changed too: side zones on Jebus Cross are more interesting and the Sprint/Harmony/Exodus templates speed...
#SteamAndEpic #Unfrozen #CHEATERS #Elements #Whisper #Harmony
Почему WER недостаточно: Семантическая декомпозиция ошибок ASR
В продуктах, построенных поверх моделей распознавания речи (Automatic Speech Recognition models, ASR), качество распознавания речи напрямую влияет на пользовательский опыт. О том, какие есть методы оценки качества таких моделей, какие у них ограничения и как мы измеряем качество их работы — и пойдет речь.
https://habr.com/ru/articles/1043102/
#wer #asr #ner #nlp #речевые_технологии #распознавание_речи #whisper #машинное_обучение #Оценка_качества_моделей #речь_в_текст
🛡️Patch 0.80.18 for Heroes of Might and Magic: Olden Era, rebalance, map tweaks and a crackdown on CHEATERS.
Developers reworked the expert subskill "Whisper of the Elements", made "Avatar Summon" a pure magic ability, adjusted passive "Parry", buffed lagging upgraded units, polished the random map generator (side zones on Jebus Cross are more interesting now) and sped up games via Sprint/Harmony/Exodus templates. They also clos...
#SteamAndEpic #Magic #Developers #CHEATERS #Elements #Whisper
Whisper или GigaAM для русского ASR в продакшене: три ловушки бенчмарка, которые перевернут ваши выводы
Полгода назад мы публиковали статью про то, как получили 3.3% WER для русского ASR с GigaAM. Замеры шли на пяти TTS-фрагментах из аудиокниг, что подтверждало тезис «специализация бьёт универсальность». С тех пор мы перемерили обе модели на реальных продакшен-записях и попали в три ловушки бенчмарка. Первый замер показал «GigaAM впереди Whisper на 7 pp». На тех же данных, после небольшой чистки, обе модели идут вровень. А на самом шумном клипе с реверберацией Whisper уходит вперёд на 19 pp. Это всё на одном подкасте, с одними и теми же скриптами, одними и теми же моделями. Детали разбираем под катом. Протестировали 10 методов «улучшения» аудио (большинство сделали хуже), измерили RTF на RTX 4090 и сформулировали финальный выбор: GPU - до обученный Whisper-turbo, CPU - GigaAM v3-e2e-rnnt. И почему именно так.
https://habr.com/ru/articles/1042574/
#распознавание_речи #ASR #Whisper #GigaAM #WER #fasterwhisper #бенчмарк #finetuning #русский_ASR #оффлайнраспознавание

Пару месяцев назад мы публиковали статью про то, как получили 3.3% WER для русского ASR на CPU с GigaAM - главный тезис тогда был «специализация бьёт универсальность». Замеры в той статье шли на пяти...
Qwen3.5 на двух V100, reverse SSH вместо Cloudflare в Telegram Mini App: собираю AI-репетитора английского
У меня в углу комнаты стоит сервер с двумя Tesla V100 32GB. Они доcтались мне для другой задачи, которая отвалилась, и полгода стояли мёртвым грузом. Параллельно я в очередной раз пробовал заниматься английским — Simpler, Doalingo, ещё пара продуктов. Хорошие, но мне не подходил формат: я хотел сценарий «открыл телефон дома на семь минут, поговорил, закрыл». Без расписания, без камеры, без поиска тьютора, который понимает мой акцент с пятого раза. Сошлось. Идея: Telegram Mini App, в нём кнопка «говорить», за ней — AI-репетитор, который слышит, что я сказал, отвечает голосом, помнит контекст разговора, тыкает в мои повторяющиеся ошибки и подбрасывает слова, которые я пытаюсь выучить. Полностью бесплатно. Модель Qwen3.5 вышла 25 февраля , я её гоняю всего несколько недель, продукт сырой. Эта статья — про архитектурные решения и про то, на какие грабли я уже успел наступить.
https://habr.com/ru/articles/1042166/
#vllm #qwen35 #telegram_bot #telegram_mini_apps #aiogram_3 #fastapi #selfhosted_llm #kokoro_tts #whisper #tesla_v100

У меня в углу комнаты стоит сервер с двумя Tesla V100 32GB. Они доcтались мне для другой задачи, которая отвалилась, и полгода стояли мёртвым грузом. Параллельно я в очередной раз пробовал заниматься...