Mein neuester #Blog Beitrag beschreibt meinen Workflow mit #KI vom #Sprachmemo zum #Text.

Betrachtet ihn gleichzeitig als Versuch und Dokumentation:

https://davidlohner.de/mit-ki-vom-sprachmemo-zum-fertigen-text/

Mit KI vom Sprachmemo zum fertigen Text

Wie Audioaufnahmen mit Hilfe von KI zu fertigen Texten werden können – und dabei (halbwegs) authentisch formuliert sind.

David Lohner
@davidlohner bin etwas enttäuscht, da ich von einer die digital souveränen Lösung ohne big tech ausgegangen bin. Direkt zu Anfang wird deutlich, dass dein Ansatz auf Apple basiert. Ein Kommentar bringt zusätzlich MS ins Spiel. Schade, wenn nicht traurig, da es Abhängigkeiten weiter manifestiert.
@chris_ prinzipiell kannst du auch mit jeder anderen App die Sprachmemos aufzeichnen, musst sie dann aber duch ein weiteres Transkriptionen-Tool jagen. Am weitesten verbreitet scheinen mir dafür zur Zeit Tools zu sein, die auf Whsiper von OpenAI aufbauen. Die Modelle kann man auch lokal speichern.

@chris_ uh, ich sehe gerade, dass es sowas auch für die Nextcloud gibt: https://docs.nextcloud.com/server/latest/admin_manual/ai/app_stt_whisper2.html

Aber da ist dann die Rede von empfohlenen 10-20 Cores auf dem Server. Puh.

App: Local Whisper Speech-To-Text (stt_whisper2) — Nextcloud latest Administration Manual latest documentation