Mastodawn

David Lohner Apr 6, 2025

Mein neuester #Blog Beitrag beschreibt meinen Workflow mit #KI vom #Sprachmemo zum #Text.

Betrachtet ihn gleichzeitig als Versuch und Dokumentation:

https://davidlohner.de/mit-ki-vom-sprachmemo-zum-fertigen-text/

Mit KI vom Sprachmemo zum fertigen Text

Wie Audioaufnahmen mit Hilfe von KI zu fertigen Texten werden können – und dabei (halbwegs) authentisch formuliert sind.

David Lohner

Show thread

chris_Apr 18, 2025

@davidlohner bin etwas enttäuscht, da ich von einer die digital souveränen Lösung ohne big tech ausgegangen bin. Direkt zu Anfang wird deutlich, dass dein Ansatz auf Apple basiert. Ein Kommentar bringt zusätzlich MS ins Spiel. Schade, wenn nicht traurig, da es Abhängigkeiten weiter manifestiert.

Show thread

David Lohner Apr 18, 2025

@chris_ prinzipiell kannst du auch mit jeder anderen App die Sprachmemos aufzeichnen, musst sie dann aber duch ein weiteres Transkriptionen-Tool jagen. Am weitesten verbreitet scheinen mir dafür zur Zeit Tools zu sein, die auf Whsiper von OpenAI aufbauen. Die Modelle kann man auch lokal speichern.

Show thread

David Lohner

@chris_ uh, ich sehe gerade, dass es sowas auch für die Nextcloud gibt: https://docs.nextcloud.com/server/latest/admin_manual/ai/app_stt_whisper2.html

Aber da ist dann die Rede von empfohlenen 10-20 Cores auf dem Server. Puh.

Mit KI vom Sprachmemo zum fertigen Text

App: Local Whisper Speech-To-Text (stt_whisper2) — Nextcloud latest Administration Manual latest documentation