Написал локальный рекордер созвонов для Linux за 3 дня и потом 2 недели менял имена и допиливал баги )

Последние пару месяцев у меня случилось много разных созвонов на английском. В целом, я обычно нормально все понимаю, но боюсь упустить что-то важное. Даже субтитры помогают лишь частично. То есть нужен костыль (или аугментация). Поискал, что есть из того, что может пригодиться. ... Так в итоге появился мой опенсорсный проектик Читать полностью

https://habr.com/ru/articles/1019742/

#whisper #aur #созвон #созвоны

Написал локальный рекордер созвонов для Linux за 3 дня и потом 2 недели менял имена и допиливал баги )

Последние пару месяцев у меня случилось много разных созвонов на английском. В целом, я обычно нормально все понимаю, но боюсь упустить что-то важное. Даже субтитры помогают лишь частично. То есть...

Хабр
Shot Glass Journal - Sumedha Motilall

RE: https://mastodon.social/@zugaldia/116351933343098498

The "Speed of Sound" app by @zugaldia, once you set up a custom global keyboard shortcut that doesn't conflict with GNOME's, is pretty amazing: https://flathub.org/en/apps/io.speedofsound.SpeedOfSound

This is the first time I experience reliable speech recognition for #dictation on the desktop, particularly on #Linux! Until now I had given up on that being a possibility.

Works really well in English. It struggles with French, but who doesn't?!

#Whisper #speechrecognition #GNOME #accessibility #a11y

AI для умного дома: что уже работает сегодня (часть 1)

В статье — не просто список инструментов, а как они сочетаются , какие подводные камни ждут при развёртывании, какие цифры можно ожидать по производительности и как обойти ограничения Llama 8B без облачных кредитов.

https://habr.com/ru/articles/1014246/

#умный_дом #Home_Assistant #Ollama #OpenClaw #MCP #LLM #локальный_AI #Whisper #n8n #голосовое_управление

AI для умного дома: что уже работает сегодня (часть 1)

В статье — не просто список инструментов, а как они сочетаются , какие подводные камни ждут при развёртывании, какие цифры можно ожидать по производительности и как обойти ограничения Llama 8B без...

Хабр
boston, massachusetts
january 1970

costume party

https://www.flickr.com/photos/dboo/266256360
https://www.flickr.com/photos/dboo/41848353951/

part of an archival project, featuring the photographs of nick dewolf

© the Nick DeWolf Foundation
Image-use requests are welcome via nickdewolfphotoarchive [at] gmail [dot] com

#photography #film #bw #blackandwhite #35mm #boston #people #women #costumes #whisper #secret #1970s

Wes Roth (@WesRoth)

AI 음성 받아쓰기 앱으로 알려진 Willow가 실시간 받아쓰기에 특화된 자체 STT 모델 Atlas 1을 출시했다. 기존 범용 모델보다 실시간 음성 입력에 맞춰 설계된 점이 핵심이며, 빠르고 정확한 전사 성능을 목표로 한다.

https://x.com/WesRoth/status/2039538310637601274

#speechtotext #voicedictation #aimodel #realtime #whisper

Wes Roth (@WesRoth) on X

Willow, the startup behind the popular AI-powered voice dictation app, launched Atlas 1, a proprietary speech-to-text (STT) model designed specifically for real-time dictation. While legacy models (like OpenAI's Whisper) typically score a 5-7% WER on clean audio and plummet to

X (formerly Twitter)

Speed of Sound Demo // Voice to Text on the Linux Desktop

https://tilvids.com/w/qmvsJvjDZ6Q95duzVw27pN

Speed of Sound Demo // Voice to Text on the Linux Desktop

PeerTube

LoRA не помогла: как мы дообучали Mistral 7B на русском и что в итоге сработало

Каждый раз после созвона происходит одно и то же самое: кто-то открывает чат и пишет «итак, что мы решили?». Дальше — пятнадцать минут на то, чтобы восстановить то, что только что обсуждали час. Я ML-инженер, и эта боль мне была знакома лично. Когда появилась идея автоматизировать протоколирование встреч, казалось, что задача решаемая: берешь Whisper для распознавания речи, хорошую LLM для суммаризации — и готово. Реальность оказалась другой. Готовых русскоязычных решений нужного качества не было. Mistral 7B — одна из лучших открытых моделей на тот момент — на русском ошибался в склонениях, плохо следовал русскоязычным промптам и терял смысл в длинных диалогах. Стало понятно: придётся дообучать самим.

https://habr.com/ru/articles/1017634/

#llm #mistral #lora #дообучение #nlp #nlp_обработка_текста #finetuning #whisper #суммаризация #bertscore

LoRA не помогла: как мы дообучали Mistral 7B на русском и что в итоге сработало

Каждый раз после созвона происходит одно и то же самое: кто-то открывает чат и пишет «итак, что мы решили?». Дальше — пятнадцать минут на то, чтобы восстановить то, что только что обсуждали час. Я...

Хабр

Falls du mit deinem Computer reden willst: Da hab ich was gemacht: https://github.com/jedie/stt2desktop

Alles lokal, ohne Clouddienste!

Kann man generisch für alles nutzen, weil es einfach den aktuell eingesprochenen Text an die Stelle des Cursors einfügt. Man kann einfach ins Mikrofon Deutsch oder Engisch (oder was anderes) sprechen, das funktioniert dank #Whisper eigentlich ziemlich gut.

#OpenSource #Python #STT #LocalLLM

GitHub - jedie/stt2desktop: Local speech-to-text for desktop using faster-whisper

Local speech-to-text for desktop using faster-whisper - jedie/stt2desktop

GitHub

💡 Join the workshops of the 𝗥𝗲𝘀𝗲𝗮𝗿𝗰𝗵 𝗦𝘂𝗽𝗽𝗼𝗿𝘁 𝗛𝘂𝗯! Experts form multiple CIT teams give support tot researchers @universityofgroningen.

𝗨𝗽𝗰𝗼𝗺𝗶𝗻𝗴 𝗲𝘃𝗲𝗻𝘁𝘀 𝗶𝗻 𝗔𝗽𝗿𝗶𝗹
🌟 2 April: DCC Workshop: #FAIR publishing data in DataverseNL
🌟 9 April: Introduction to #AI tools
🌟 9 April: Working with #Python on Hábrók
🌟 16 April: Webscraping using #Python
🌟 23 April: Introduction to #AI tools
🌟 23 April: #CodeCafé
🌟 30 April: Safely transcribing audio with #Whisper

ℹ️ https://www.rug.nl/society-business/center-for-information-technology/research/rsh/rshcalendar/

#researchsupport