Mastodawn

Hello, je cherche un moyen de faire de la commande vocale en #js, en continu, idéalement avec une lib la plus légère possible. SpeechRegognition existe depuis des années mais pas activé par défaut sous Firefox... Une solution nécessitant un serveur pourrait convenir si le côté serveur est opensource et que je peux l'héberger moi-même (même si j'ai peur que ce soit moins réactif...)
Quelqu'un connaitrait une solution ?

#speech2text #speechrecognition #dev #webdev

Regendans Jun 8

Some people with Australian accents reporting problems which are solved by faking UK or USA accents. 😄

And this speech to text (offline) application seems cool.

👉 https://handy.computer 👈

Thread : https://lemmy.world/post/47731678

#speech2text #opensource #language #speechtotext

Handy

Handy is a cross platform, open-source, speech-to-text application for your computer

Handy

Show thread

Thomas Fricke (he/his)May 6

@correctiv_org @digiges

Cellebrite ist wahrscheinlich nicht mal #KI jenseits von #speech2text und #ocr, aber die Anwälte können darin nicht mal Entlastung suchen, weil sie 12TB nicht auswerten können. #Polizei übrigens fast auch nicht.

Zusammen mit der #Europol Schatten IT ist der Schaden für den Rechtsstaaat nicht absehbar.

@AwetTesfaiesus @GrueneBundestag

Reddit Tech VN Bot Dec 19, 2025

Tìm công cụ **chuyển giọng nói sang chữ** mã nguồn mở?
Whisper (OpenAI) là lựa chọn hàng đầu cho độ chính xác cao với hỗ trợ mô hình lớn (phù hợp VRAM 32GB). Ngoài ra, các công cụ như Kaldi, DeepSpeech (Mozilla), và NVIDIA NeMo cũng đáng cân nhắc tùy nhu cầu. #KỹThuật #AI #PhátTriểnMở #Speech2Text #CôngNghệVN

https://www.reddit.com/r/opensource/comments/1pqis1r/any_good_open_source_speech_to_text_tools/

michabbb Sep 17, 2025

Add #speech2text to your #omarchy (#arch #linux) 🎙️ 🤖 😊

Since there is no WhisperFlow for Linux, I was forced to find something else. It's not perfect, but it works well enough, and it's 100% local ❤️ 🔒

https://github.com/michabbb/omarchy-speech-to-text

#ai #coding

Sebastian Sep 9, 2025

Ich suchte ein LLM das lokal auf meinem Handy #Speech2Text machen kann und ich fand das großartige whisperIMEplus. Es klinkt sich in die Tastatur per Icon ein und lässt sich per Knopfdruck aufrufen und zeichnet sofort Audio auf, das dann an den Cursor gepastet wird. So soll das sein

https://github.com/woheller69/whisperIMEplus

GitHub - woheller69/whisperIMEplus: Android Input Method Editor (IME) based on RTranslators Whisper implementation

Android Input Method Editor (IME) based on RTranslators Whisper implementation - GitHub - woheller69/whisperIMEplus: Android Input Method Editor (IME) based on RTranslators Whisper implementation

GitHub

Jan

Aug 31, 2025

Progress on my little speech2text/transcription project:

1. You press some hotkeys.
2. You speak into your microphone.
3. You wait for approx. 10 secs. (depending on your hardware)
4. Text starts to magically appear on your screen!

It feels like True Magic™! 🪄 ✨

This is why I love software development! ❤️

#Speech2Text #AI #Whisper #Rust #RustLang #Audio #AudioTranscription

Habr Jul 11, 2025

Используем API Speech2Text для распознавания записей разговоров

В нашей компании анализируются звонки менеджеров отдела продаж для оценки их эффективности, устранения недочётов и улучшения сервиса. На сегодняшний день это составляет немалый массив ручной работы, для облегчения которой мы задумали привлечь технологии искусственного интеллекта. Идея следующая: забираем записи звонков, распознаём речь (преобразовываем в текст), подключаем LLM для анализа текста, знакомимся с выводами, при необходимости (например, возникновении каких-то аномалий) контролируем происходящее вручную. Распознавание аудио решили делать через сервис Speech2Text, пример использования API которого я и покажу в этой статье. В черновом варианте получаем примерно следующую схему работы (нас сейчас интересует прямоугольник с подписью Speech2Text connector):

https://habr.com/ru/articles/926918/

#Speech2Text #api

Используем API Speech2Text для распознавания записей разговоров

Хабр

Jordi Cabot Jul 6, 2025

#Multilingual #Speech2Speech #Agents are here!

Supporting the latest #OpenAI Speech Models and more. Also works for #Luxembourgish!

⚙️https://besser-agentic-framework.readthedocs.io/latest/release_notes/v4.0.0.html

#opensource #python #text2speech #speech2text #languagedetection #nlp #lowcode #llm #rag

Version 4.0.0 - BAF 4.0.0

[email protected]Apr 7, 2025

#Speech #Note – #Notizen und mehr -

Bei der Recherche für einen Artikel über #Text2Speech und #Speech2Text unter #Linux bin ich auf die kleine App Speech Note gestoßen, nicht zu verwechseln mit dem proprietären SpeechNotes. Insofern ist der Name nicht wirklich clever gewählt. Clever ist dagegen das Konzept der noch jungen Anwendung.

Speech Note ist eine vielseitige Anwendung für Notizen, die durch ihre Funktionen und Datenschutzorientierung hervorsticht.

https://linuxnews.de/speech-note-notizen-und-mehr/

Speech Note – Notizen und mehr

Speech Note ist eine Notiz-App, die zusätzlich Übersetzung und Sprachsynthese per Text2Speech und Speech2Text beherrscht.

LinuxNews.de