🎧 Want to turn audio into text – but have zero coding skills and can’t install anything? No worries!

🚀 Dive into our step‑by‑step tutorial on using **#Whisper** for automated speech recognition. It’s easy, free, and runs right in Galaxy.

🔗 **Check it out:** https://gxy.io/GTN:T00577

💡 Powered by @galaxyfreiburg & @gtn

#usegalaxy #opensource #oralhistory #OER #DataScience #humanities

Redirecting…

Почему Cluely и другие плохо слышат русских айтишников: разбор того, как Whisper ломается и что мы сделали с этим

В январе я купил подписки на Cluely, Final Round AI и Sensei. Хотел посмотреть как они справляются с русским айти-собесами, раз уж все три заявляют о поддержке русского. Подключил по очереди к тестовому звонку в Телемосте (сомневаюсь, что платформа имела роль, но все же), прогнал одну и ту же запись: Senior Python backend разработчик, 45 минут, стек FastAPI + PostgreSQL + Kafka + Kubernetes. Обычный русский спикер, если важно - из Москвы, с речью проблем не было, нормальный микрофон Все три выдали транскрипт и все три провалились, как неожиданно.. "Кафка" в половине случаев становилась "как-то" или "кофта". "Кубернетис" превращался в "губер нет тест". "Сабскрайбер патерн" - в "саб скрайп патерн". "Middleware для CSRF" - "мидл-вер для си эс эр эф" - это еще норм Проблема не в том, что человек говорил по-русски, и не в том, что Whisper не умеет русский (сноска: хорошо не умеет). Whisper умеет русский нормально, около 9.8% WER на Common Voice. Проблема в другом: русскоязычный айтишник не говорит ни на чистом русском, ни на чистом английском. Он говорит на гибриде: русская грамматика плюс английские термины плюс своеобразное произношение этих терминов плюс местами свой жаргон вроде "гошечки" и "крудошлёпа" Этот гибрид ни один из популярных STT не держит. Потому что его в тренировочных данных почти нет Разбираю ниже, как устроена эта проблема, что с ней делают конкуренты (почти ничего), и что сделали мы

https://habr.com/ru/articles/1026778/

#Whisper #STT #speechtotext #finetuning #LoRA #ASR #NLP #распознавание_речи #русский_язык #codeswitching

Почему Cluely и другие плохо слышат русских айтишников: разбор того, как Whisper ломается и что мы сделали с этим

фото с реального собеседования нашего клиента В январе я купил подписки на Cluely, Final Round AI и Sensei. Хотел посмотреть как они справляются с русским айти-собесами, раз уж все три заявляют о...

Хабр

Scrivere senza tastiera su Linux è possibile 🎙️ Scopri Speed of Sound e il riconoscimento vocale offline #Linux #OpenSource #Whisper #SpeechToText #Software

https://www.linuxeasy.org/speed-of-sound-porta-la-dettatura-vocale-su-linux/?utm_source=mastodon&utm_medium=jetpack_social

Texte flüstern mit Speed of Sound

Mit "Speed of Sound" gibt es eine neue Anwendung, die Gesprochenes in geschriebenen Text umwandelt. Dabei kommt das kleine Whisper-LLM von OpenAI zum Einsatz. Wie gut das funktioniert, lest ihr hier.

#STT #Whisper #OpenAI #Speech_to_Text #Linux

https://gnulinux.ch/texte-fluestern-mit-speed-of-sound

Texte flüstern mit Speed of Sound

Mit "Speed of Sound" gibt es eine neue Anwendung, die Gesprochenes in geschriebenen Text umwandelt. Dabei kommt das kleine Whisper-LLM von OpenAI zum Einsatz. Wie gut das funktioniert, lest ihr hier.

GNU/Linux.ch

I updated the driver on my Epson Perfection V500 photo/slide scanner (6400 DPI) today, but using it is a bit limited without access to Photoshop and Creative Cloud. Still, it warmed up enough to attract Whisper.

#whisper #whisperthewonderpuss #cats #pets #northdakota

Type with your voice on Linux using this Whisper-based app - OMG! Ubuntu

Your mouth can say things faster than your hands can type them, yet voice typing is rarely used as a primary input method on desktop (most of us think

OMG! Ubuntu
#AI小説 #season 季節の色 Кольори пори - Deadly_Poisonの小説 - pixiv

木々の葉は静かに落ち 手と手、肌と肌が寄り添い 髪へと舞い降りる ホムラ色の葉の囁き 凍てつく風は吹き荒れ 触れるものすべてから 水分と温もりを奪い去る それでも世界は染め上げられる 落ち葉の絵筆が描くキャンバスに どれほど冷たい風でも 指先の温もりまでは奪えない ホムラと黄金が

pixiv

【切り抜き動画作成?!】mlx-whisper × Remotion × Claude Codeで会議録画から 60 秒ハイライト動画を自動生成してみた
https://qiita.com/takatein/items/c7cbec541a00c568e345?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items

#qiita #whisper #Gemini #remotion #ClaudeCode

【切り抜き動画作成?!】mlx-whisper × Remotion × Claude Codeで会議録画から 60 秒ハイライト動画を自動生成してみた - Qiita

こんにちは、takatein です。 突然ですが、みなさんは会議録画ってちゃんと見返してますか? ぶっちゃけ、わたしはほぼ見返さないです。1 時間の Google Meet 録画が日々溜まっていって、「あとで誰かに共有したいやつだけ抜き出したい」と思いつつ、結局そのまま放置...

Qiita
季節の色 Кольори пори|Deadly_Poison

木々の葉は静かに落ち 手と手、肌と肌が寄り添い 髪へと舞い降りる ホムラ色の葉の囁き 凍てつく風は吹き荒れ 触れるものすべてから 水分と温もりを奪い去る それでも世界は染め上げられる 落ち葉の絵筆が描くキャンバスに どれほど冷たい風でも 指先の温もりまでは奪えない ホムラと黄金が交わり 麗しく舞い昇るその瞬間 降り注ぐ小雨は虹を孕み 光の粒となり輝き 紅葉をさらに引き立てる 儚くも鮮やかな季節の詩 <> Кольори пори Листя з дерев тихо спадає, долоня до долоні, шкіра до шкіри — поруч.

note(ノート)

Mikeysee (@mikeysee)

Voice Type이 Mac에서 무료로 제공되며, Whisper Flow를 대체하거나 활용할 수 있는 음성 입력 도구로 소개되었다. 맥용 AI 음성 입력/타이핑 도구의 새로운 사용 사례로 볼 수 있다.

https://x.com/mikeysee/status/2045288314169966704

#voicetyping #mac #whisper #productivity #ai

Mikeysee (@mikeysee) on X

Want your on Whisper Flow for free? Voice Type is available on Mac now and it works great!

X (formerly Twitter)