Mastodawn

Der Mac macht einen 27 Jahre alten Rückstand wett

Darauf hat die Welt gewartet – na ja, nicht die ganze Welt, aber zumindest jener Teil, der mit einem Mac arbeitet und Wert auf ein vernünftiges Dateimanagement legt.

Ich spreche von ShichiZip. Das ist eine Adaption des bekannten Komprimierungsprogramms 7-Zip für den Mac. Das Original existiert seit 27 Jahren. Es ist Open Source und gewinnt keinen Preis als allerbenutzerfreundlichstes Programm der Welt. Aber es wartet mit einem Funktionsumfang auf, der keine Wünsche übrig lässt.

ShichiZip: Die Ähnlichkeit zu 7-Zip ist nicht zu übersehen.

Und bevor ihr fragt: Ja, shichi bedeutet 7 auf Japanisch. Zumindest in der On-Lesung – aber ich werde hier nicht vorgeben, als hätte ich dieses Detail verstanden.

Klar hingegen ist, dass dieses neue Programm eine Lücke schliesst. Zwar existieren auch für den Mac Shareware-Programme wie Betterzip, das mir seinerzeit gute Dienste leistete. Aber genauso wie bei den kommerziellen Produkten für Windows (Winzip oder WinRAR) rechnen sich diese Bezahlprogramme nur bei intensiver Nutzung. Für den normalen Alltag geben wir uns mit der Komprimierungsfunktion des Finders zufrieden und bemühen, falls es nötig ist, für Spezialaufgaben das Terminal¹.

Alles da, alles funktioniert

ShichiZip liegt in einer sehr frühen Alphaversion vor. Gleichwohl macht die Software einen soliden Eindruck: Sie zeigt bereits deutsche Programmtexte an – wenngleich mit diversen Lücken –, und sie funktionierte bei meinem Test einwandfrei. Ich packte u.a. eine dicke vorhandene Testdatei mit einigen Hundert Dokumenten aus und erstellte ein passwortgeschütztes Archiv, das sich unter Windows problemlos auspacken liess.

Es fehlt nichts: Der Dialog, mit dem ein Archiv mit Dateien bestückt wird.

Der Funktionsumfang wirkt vollständig. Beim Verpacken der Dateien haben wir ungefähr die gleichen Optionen zur Auswahl, wie bei Windows:

Diverse Formate (7z, zip, gzip, bzip2, xz, tar und wim)
Sieben Kompressionsstärken von unkomprimiert bis Ultra+.
Diverse Kompressionsverfahren.
Wählbare Wörterbuch- und Wortgrössen.
Speichernutzung
Aufteilung grosser Archive in Segmente
Relative, absolute und komplette Pfadangaben
Mehrere Aktualisierungsmethoden bei bestehenden Archiven (Hinzufügen und Ersetzen, Aktualisieren und Hinzufügen, vorhandene Dateien aktualisieren und Synchronisieren).
Es können selbst extrahierende Windows-Archive erstellt, die Mac-Ressourcen ausgeklammert, geöffnete Dateien einbezogen und die Originaldateien nach der Komprimierung gelöscht werden.
Und wie erwähnt: Es gibt die Option zur Verschlüsselung und je nach Format kann auch die Verschlüsselungsstärke gewählt werden.

Zum Vergleich: So sieht der Dialog «Zu Archiv hinzufügen» bei Windows aus.

Fazit: In gewisser Weise ist die Beschäftigung mit solchen Dateihilfsprogrammen ein Flashback in die Blütezeit des Personal Computers, als es noch keine Cloud und schon gar keine künstliche Intelligenz gab und wir selbst darum bemüht sein mussten, in unseren Datenbeständen Ordnung zu halten. Da die Festplatten notorisch klein waren, gewöhnte ich mir rasch an, die abgearbeiteten Projekte in Zip-Dateien zu archivieren.

Fast wie Winzip 8 – nur besser

Das tat ich damals mit dem Klassiker Winzip, der schon 1991 auf den Markt gekommen war. Aus meiner Kurzmeldung im «Zürich Express» (heute wieder Tagblatt der Stadt Zürich) geht hervor, dass die Version 8 auf einem physischen Speichermedium und mit gedrucktem Handbuch für solide 78 Franken zu haben war. Erklärt das doch mal euren Kindern: Ein Programm für Dateien ausserhalb der Cloud! Auf CD-ROM! Mit gedrucktem Handbuch!

Fussnoten

1) Mit dem Terminal ist es bei Mac OS beispielsweise möglich, verschlüsselte Archive zu erstellen, was im Finder nicht möglich ist. Wir verwenden den Befehl zip und den Parameter e für Encrypt. Dann erst der Name des zu erstellenden Archivs und anschliessend die zu komprimierenden Dateien. Als zum Beispiel:

zip -e /Users/matthiasschussler/Desktop/geheim.zip /Users/matthiasschussler/Documents/Prompts.rtf

Weitere Parameter:

-r führt zu einer rekursiven Bearbeitung aller Unterverzeichnisse, bei der sämtlichen Dateien ins Archiv au
-x (eXclude) exkludiert bestimmte Dateien (z. B. -x "*.DS_Store").
-v steht für verbose und bringt die App dazu, Vorgänge durch detaillierte Statusinformationen zu protokollieren.
-q bewirkt das Gegenteil: Der Parameter quiet unterdrückt Statusangaben im Terminal. ↩

Beitragsbild: Dieser Vorgang nennt sich komprimieren (Timur Weber, Pexels-Lizenz).

#FreieSoftwareFOSS

Matthias Apr 23

Meerjungfrauen plotten besser

Mermaids sind diese Meeresbewohner, die angeblich besser küssen. Um die soll es hier (zur Enttäuschung von neunzig Prozent der männlichen Leserinnen) nicht gehen. Stattdessen möchte ich euch darauf aufmerksam machen, dass Mermaid im digitalen Kontext eine Software und vor allem eine Auszeichnungssprache bezeichnet.

Letztere hat eine Verwandtschaft zu Markdown. Sie ist einfach gehalten, strukturiert die Inhalte mittels simpler Steuerzeichen, und sie ist dazu da, Diagramme in Textform zu beschreiben. Die Sprache eignet sich für diverse Typen, u. a. Flowcharts, Sequenzen und Gantt-Balken. Sie ebnet dem Austausch dieser Darstellungen zwischen einzelnen Anwendungen den Weg. Aber darüber hinaus ist sie nicht weltbewegend – oder?

Gemini liefert auf Wunsch eine Antwort nicht in Textform, sondern in Form von Rohdaten für eine technische Illustration.

Nein, aber es ergibt sich ein spannender Anwendungsfall: Die meisten gängigen Sprachmodelle sind in der Lage, Informationen in dieser Form auszugeben. Im Prompt fragen wir nach einem hierarchischen Wissensgraph mit Mermaid.js-Syntax.

Der Bundesstaat als Flussdiagramm

Für einen Sonntagszeitungs-Artikel spiele ich das für einige Beispiele durch. Ein erster Versuch besteht darin, die wesentlichen Aspekte der Schweizer Bundesregierung in ein Diagramm umzuwandeln. Gemini liefert umgehend das Code-Snippet, das ich probehalber bei mermaid.live/edit eingebe. Das ist die kostenlose Online-Anwendung, die auf Github auch im Quellcode verfügbar ist.

Das Resultat ist eine untadelige Visualisierung, die sich im Browser ansehen und per Link weitergeben lässt. Falls ich es richtig verstanden habe, stecken sämtliche Informationen in der (ellenlangen) URL, sodass die gewissermassen auch als Dateispeicherung fungiert. Bearbeiten lässt sich das Diagramm nicht, aber es lässt sich als PNG-Grafik und im Vektorformat SVG exportieren.

Einen ausgewachsenen Editor findet sich unter mermaid.ai. Diese Anwendung ist nicht kostenlos wie die Basisvariante, sondern benötigt ein Abo: Es gibt zwei Preispläne, Plus für zehn und Premium für zwanzig US-Dollar pro Jahr. Für dieses Geld gibt es die Möglichkeit, die Diagramme in der Cloud zu speichern und zu bearbeiten. Mehrere Leute können via Team-Funktion an den gleichen Projekten arbeiten.

Die KI hilft auch bei der Bearbeitung

Wie die URL andeutet, erstellt die Cloud-Variante von Mermaid Diagramme automatisch per KI. Das wirkt auf den ersten Blick überflüssig, da dank Mermaid.js-Syntax wie beschrieben «normale» Sprachmodelle in der Lage sind, diese Arbeit zu erledigen. Allerdings kann die Mermaid-KI nachträglich einzelne Elemente über einen Prompt modifizieren – was ungeübte User allenfalls nützlich finden.

Das per KI generierte Diagramm im Editor von Mermaid.ai.

Die Features sind ansonsten überschaubar: Wir wählen zwischen mehreren Looks (Neo, Handgezeichnet und Classic), wechseln zwischen den zehn zur Auswahl stehenden (und meines Erachtens nicht sonderlich extravaganten) Themes oder modifizieren Elemente manuell, wobei wir Farbe bzw. Farbschema, Form, Konturen und Linien ändern, zwischen manuellem und automatischem Layout umschalten und mit Bildern und Icons operieren. Eine nicht zu unterschätzende Funktion steckt in der Change direction-Schaltfläche mit den beiden Winkeln: Sie ändert die Orientierung. Statt von oben nach unten fliesst das Diagramm von links nach rechts, von rechts nach links oder von unten nach oben.

Richtig schön wirds mit Excalidraw

Nun ist meine Lieblings-App für Flussdiagramme und andere technische Darstellungen jedoch erklärtermassen Excalidraw. Die Frage liegt auf der Hand: Bekomme ich das KI-generierte Diagramm auch in dieses Programm hinein?

Das finale Resultat: Das Diagramm, erstellt und moderat in der tollen Excalidraw-App nachbearbeitet.

Die Antwort ist erfreulicherweise ein Ja. Auf Github findet sich das Konvertierungsprogramm Mermaid-to-excalidraw, das online benutzbar ist. Und voilà, mit einem kleinen Umweg landet das KI-generierte Diagramm in der Lieblings-Anwendung, wo es nach allen Regeln der Kunst aufgehübscht und nachbearbeitet werden kann. Sind solche simple, offene Auszeichnungssprachen nicht grossartig?

Beitragsbild: Sie hat diesen Trick hier garantiert nicht nötig. Für uns Anfängerinnen und Anfänger ist die Mermaid-Auszeichnungssprache jedoch eine riesige Hilfe (Pavel Danilyuk, Pexels-Lizenz).

#Datenvisualisierung #FreieSoftwareFOSS #KI #KIQuicktipp #Markdown #Publisher

Matthias Feb 25

Die Browser in die Schranken weisen

Ist es zu viel verlangt, von seinem eigenen Computer nicht bevormundet werden zu wollen?

Diese Frage stelle ich mir jedes Mal, wenn mir ein Browser vorschlägt, als Standardbrowser eingerichtet zu werden. Mein bevorzugtes Surfprogramm ist Firefox. Doch aus beruflichen Gründen nutze ich ebenso Chrome und gelegentlich Edge. Die letzteren beiden nehmen diese Gelegenheiten jeweils wahr, um in nervtötender Regelmässigkeit darum zu betteln, Firefox vom Thron zu stossen. Klingt es arg altväterlich, wenn ich darauf hinweise, dass es derlei Impertinenz früher nicht gab? (Als Internet Explorer 96 Prozent Marktanteil hatte.)

Also, fürs Protokoll: Mein Entscheid für Firefox fiel aus guten Gründen und ich beabsichtige nicht, ihn umzustossen. Und falls ich das tun würde, dann nicht aufgrund eines «Vorschlags» von Edge oder Chrome.

Keine KI, keine Telemetrie, kein Sponsoring und keine Pop-ups

Die Aufgabe liegt auf der Hand: Gefragt ist eine Methode, um dieser Belästigung Einhalt zu gebieten. Bei meinen Nachforschungen stiess ich auf justthebrowser.com. Das ist ein Open-Source-Github-Projekt, das den Browser auf seine wesentliche Aufgabe zurückführt und das Drumherum abstellt. Konkret werden viele der KI-Funktionen, die Übermittlungen der Telemetriedaten, gesponserte Inhalte und Integrationen mit Drittprodukten deaktiviert und das Pop-up zum Standardbrowser erhält den Todesstoss.

Diese Änderungen werden über die Einstellungen der Browser erzielt. Modifikationen am Programmcode werden keine vorgenommen. Ein Script erledigt die Arbeit. Um es auszuführen, verwenden wir unter Windows die Powershell, wobei wir sie mit Administratorrechten starten müssen. Am Mac und unter Linux kommt das Terminal zum Zug.

Das Script kann nach vollendeter Tat die Änderungen wieder rückgängig machen.

Ist es sicher? Ein Assessment per KI

Und ja, ich weiss, dass euch in diesem Moment euer innerer CSO ins Ohr brüllt, ob ihr vom Affen gebissen seid. Aber wie erwähnt: Der Quellcode ist öffentlich. Und vorsichtig, wie ich bin, legte ich den Code Claude zur Inspektion vor. Er prüfte ihn gewissenhaft und berichtete, was er tut. Die KI empfahl mir, die Registry-Dateien manuell herunterzuladen, zu prüfen und zu verwenden. Diesen Aufwand sparte ich mir, zumal Just the browser grössere Kreise gezogen hatte, ohne dass Sicherheitsprobleme bekannt geworden wären. Aber die Erkenntnis am Rand ist nützlich: KI hilft, dass wir bei Open-Source-Programmen dem Hersteller nicht blind vertrauen müssen.

Fazit: Eine praktische Sache!

Auch punktuelle Eingriffe sind möglich

Der Einwand könnte an dieser Stelle lauten, dass es schön wäre, die Browser-Disziplinierung nicht nach dem «Alles oder nichts»-Prinzip vornehmen zu müssen. Viele Leute dürften es zu schätzen wissen, die zu deaktivierenden Optionen selbst zu bestimmen. Die komfortabelste Lösung wäre ein GUI, bei dem wir nur die entsprechenden Kästchen ankreuzen müssen. Für weniger versierte Anwenderinnen würde das die Hürden senken.

Alle anderen sollten Just the Browser als Aufforderung verstehen, die Fingerfertigkeiten im Umgang mit dem digitalen Arbeitsgerät zu trainieren. Die Detailseiten zu Chrome, Edge und Firefox erklären, welche Änderungen jeweils vorgenommen werden. Sie enthalten eine Anleitung, die wie die Konfigurationsdatei angepasst und vom lokalen Computer aus ausgeführt wird. Wir haben die Möglichkeit, eine individuelle Konfiguration vorzunehmen. Und falls sich uns die Scripte nicht erschliessen, wären Claude und Co. in der Lage und willens, uns bei unseren Anpassungen behilflich zu sein.

Und klar: Idealerweise wäre der ganze Heckmeck nicht nötig – wenn die Browser-Hersteller es als Verpflichtung ansähen, uns ein maximal nützliches Werkzeug zu liefern, und nicht ihr eigenes Süppchen zu kochen.

Beitragsbild: Wer ist ein guter Firefox? Ja, weeer ist ein guuter Firefox? (Petr Magera, Unsplash-Lizenz)

#Browser #Chrome #Firefox #FreieSoftwareFOSS

Matthias Feb 24

Ein Netflix-Ersatz im Eigenbau

Um lokale Mediendateien via AppleTV auf den Fernseher zu bringen, kam in unserem Haushalt seit Jahren die Infuse-App zum Einsatz. Eine unkomplizierte Lösung, die jüngst leider nicht mehr funktionierte. Die App zeigte einen Verbindungsfehler an, gleichgültig, was ich auch probierte. Schuld ist vermutlich Tahoe.

Was tun? Nach längerem Fluchen und Herumprobieren kam ich zur Einsicht, Infuse müsse weichen. Schliesslich gibt es Alternativen, die nicht mehr auf einem Uralt-Protokoll basieren, das seit jeher ziemlich wackelig war. Meine Suche führte mich zu Jellyfin: Das ist ein Medienserver, obendrein Open Source, der sich im lokalen Netz oder auch via Internet betreiben lässt, und nicht nur für Filme und Serien taugt, sondern auch für Musik, Hörbücher und Fotos. Daraus ergibt sich eine prächtige Gelegenheit, die eigene Cloud-Abhängigkeit zu reduzieren.

Da die entsprechenden Medieninhalte auf dem Mac vorgehalten werden, installierte ich die Mac-Version. Es gibt sie ebenso für Windows, Linux und Docker. Letzteres ebnet den Weg, den Raspberry Pi als Server zu nutzen. Ich hätte noch einen übrig, bin vorerst mit der simplen Variante zufrieden.

Ob gekauft, gerippt oder anderweitig organisiert: Via Jellyfin-Server und Swiftfin-App gelangt der eigene Medienbestand auf den Fernseher.

Das Kurzfazit lautet: Es funktioniert bestens. Zumindest dann, wenn Ton und Bild nicht auseinanderlaufen. Das scheint ein bekanntes Problem zu sein. Alle Geräte neu zu starten, hilft vielleicht (sonst kann man versuchen, manuell einzugreifen). Wenn diese Misere ausbleibt, überwiegen die positiven Aspekte:

Jellyfin bringt die lokalen Medien auf den AppleTV.
Es gibt zwar keine native App, aber Ausweichmöglichkeiten. Mit Swiftfin gibt es eine Client-App fürs iPhone und für den AppleTV. Und die Pointe am Rand: Infuse versteht sich aufs Jellyfin-Protokoll. Die App zu löschen, war voreilig.
Der Zugriff klappt ebenso via Browser.
Am Windows-Laptop lassen sich die Filme über die lokale URL (in meinem Fall http://192.168.178.180:8096) abrufen.
Die Server-Konfiguration ist simpel.
Die Jellyfin-Anwendung am Mac klinkt sich als Icon in die Menüleiste ein. Es gibt dort wenig bis nichts einzustellen. Die eigentliche Konfiguration erfolgt über das Web-Interface. Das öffnen wir, indem wir aufs Jellyfin-Icon klicken und im Menü den Befehl Launch betätigen. Die Oberfläche erscheint daraufhin im Standardbrowser. Dort nehmen wir die Einstellungen vor. Wir verwenden das Personen-Icon in der rechten oberen Ecke, um Benutzer, inklusive Passwort, anzulegen.

Also: Eine (überwiegend) erfreuliche Sache. Abschliessend einige Tipps und Hinweise, wie Tücken zu umgehen sind:

1) Auf die IP-Adresse achten

Erstens müssen wir tunlichst darauf achten, dass der Computer, auf dem der Jellyfin-Server läuft, seine lokale IP-Adresse nicht wechselt. Am AppleTV in der Swiftfin-App lässt sie sich nicht ändern. Ich habe es nicht einmal geschafft, den lokalen Server zu löschen und neu hinzuzufügen. Die einzige Möglichkeit, das Malheur zu beheben, bestand darin, die App zu löschen und neu hinzuzufügen.

Wir können den Computer anweisen, eine bestimmte IP-Adresse abzurufen. Der bessere Weg ist allerdings, diese Konfiguration im Router vorzunehmen. Bei meiner Fritzbox geht das wie folgt:

Wir loggen uns im Backend ein, klicken in der Navigation links auf Netzwerk, wählen die Rubrik Netzwerkverbindungen aus, suchen in der Liste den Eintrag für den dazugehörenden Computer, klicken dann aufs Bleistift-Symbol, wechseln in der Ansicht Detail auf die Rubrik Heimnetzwerk und stellen sicher, dass unter iPv4-Adresse der richtige Wert erscheint. Ausserdem setzen wir die Option iPv4-Adresse dauerhaft zuweisen.

Die IP-Adresse des Servers lässt sich in der Swiftfin-App am AppleTV nicht ändern – darum sollte sie im Router fixiert werden.

Kurze Zwischenbemerkung: Wir haben das Jahr 2026. Kann es angehen, dass wir uns noch immer mit lokalen IP-Adressen herumschlagen müssen und es keine robustere Methode gibt, um Geräte im lokalen Netz anzusprechen und Dateien, Informationen und Datenströme beliebiger Art auszutauschen? Ich fühle mich versucht, eine kleine Verschwörungstheorie in Umlauf zu bringen: Microsoft, Apple und die anderen Konzerne machen das extra, weil mit all diesen Hindernissen die pfannenfertigen, aber teuren Cloud-Lösungen attraktiver erscheinen.

2) Die Konfiguration perfektionieren

Zweitens gibt es umfangreiche Einstellungsmöglichkeiten. Sie sind über den Menüknopf links oben und den Befehl Übersicht im Abschnitt Administration zugänglich. Einige Hinweise im Überblick:

In der Rubrik Bibliotheken gibt es eine gleichnamige Rubrik. Dort werden die Inhalte verwaltet. Die einzelnen Ablagen sind Verzeichnisse auf dem Server bzw. Computer. Hier lassen sich diverse Einstellungen für die Ablage, zu Untertiteln, Metadaten, Spracheinstellungen etc. treffen. Wir haben die Möglichkeit, einzelne Bibliotheken zu aktivieren und zu deaktivieren.
Über den Knopf Medienbibliothek hinzufügen stellen wir die Inhalte aus weiteren Ordnern zur Verfügung.
Bei Wiedergabe > Transkodierung legen wir fest, dass Inhalte in gewünschte Formate überführt werden, falls sie sich direkt nicht abspielen lassen. Es dürfen Parameter zum Tone-Mapping, zu Untertiteln und zum Downmix von Raumklang-Tonspuren und viele weitere Dinge angegeben werden.
Im Abschnitt Aktivitäten gibt es ein ausführliches Protokoll zum Treiben der User.
Jellyfin lässt sich vielseitig erweitern. Die entsprechenden Möglichkeiten stecken in der Rubrik Plugins.

3) Der Trick für die Untertitel

Ein Plug-in, das ich sofort installiert habe, ist das für opensubtitles.com: Es sorgt dafür, dass automatisch Untertitel in der gewünschten Sprache bereitgehalten werden. Damit das funktioniert, sind folgende Dinge nötig:

Wir richten ein Nutzerkonto bei Open Subtitles ein.
In Jellyfin hinterlegen wir die Zugangsdaten. Im Admin-Bereich navigieren wir zu Plugins, wählen Open Subtitles aus, klicken auf Einstellungen und tragen Benutzername (nicht die Mailadresse) und das Passwort ein.
Damit die Untertitel bereitgestellt werden, wenden wir uns dem Bereich Administration zu. In der Übersicht Bibliotheken betätigen wir bei der Ablage mit unseren Filmen und Serien den Menü-Knopf mit den drei Punkten und den Befehl Bibliothek verwalten. Wir wenden uns dem Bereich Untertitel-Downloads zu. Bei Herunterzuladende Sprachen geben wir die Idiome an, für die wir die Texte bereithalten möchten. Im Abschnitt Untertitel-Downloader aktivieren wir Open Subtitles und treffen die passenden Einstellungen¹.
Die Untertitel werden gemäss dem Zeitplan geladen, der im Bereich Administration im Abschnitt Geplante Aufgaben hinterlegt ist. Der Auslöser Fehlende Untertitel herunterladen stösst dieses Update an. Er scheint nicht manuell auslösbar zu sein. Wir können indes den Auslöser Beim Start der Anwendung hinzufügen.

Übrigens: Die Einstellungen zu den Untertiteln werden pro Nutzerin oder Nutzer gesetzt. Sie sind über das Personen-Icon rechts oben und die Rubrik Untertitel zugänglich. Hier legen wir die bevorzugte Sprache und die Darstellung am Bildschirm fest.

Jellyfin sorgt dafür, dass die gewünschten Untertitel automatisch zur Verfügung stehen.

4) Sich nicht von Tahoe austricksen lassen

Es kann passieren, dass der Mac während der Wiedergabe einschläft. Das verhindern wir wirkungsvoll mit Amphetamine.

Schliesslich gibt es eine wirklich dumme Hürde am Mac mit Tahoe: Wenn sich ein Programm wie Firefox im Vordergrund befindet, das eine lange Menüleiste anzeigt, dann erscheinen in der Menüleiste nicht mehr alle Icons. Deswegen stand ich erst einmal wie der Esel am Berg. Apple, echt!

Fussnoten

1) Ich empfehle, alle vier Kästchen anzuklicken: Nur Untertitel herunterladen, die perfekt zu den Videodateien passen, Überspringen, falls der Ton bereits der herunterladbaren Sprache entspricht, Überspringen, falls das Video bereits eingebettete Untertitel enthält und Untertitel in den Medienverzeichnissen speichern. ↩

#AppleTV #CiaoZurCloud #FreieSoftwareFOSS #Longread #RaspberryPi

Matthias Jan 27

So bodigt die SRG die Halbierungsinitiative

Wie kann sich das öffentlich-rechtliche Medienangebot gegen die globale Konkurrenz wie Tiktok, Youtube und Netflix behaupten? In der Schweiz stellt sich diese Frage mit besonderer Dringlichkeit, weil am 8. März die sogenannte Halbierungsinitiative ansteht: Die will die Gebühreneinnahmen für die Schweizerische Radio- und Fernsehgesellschaft (SRG) nicht halbieren, aber von jährlich 335 auf 200 Franken reduzieren. Wenn sie angenommen würde – und danach sieht es im Moment aus –, würde sich das Budget der SRG von 1,2 Milliarden auf 630 Millionen sinken. Das wäre ein radikaler Einschnitt in die hiesige Medienlandschaft.

Mir bereitet das Sorge. Und mich irritiert, wie diese Debatte geführt wird.

Die Befürworter stellen die Initiative als Beitrag zur Kostenreduktion dar, was in meinen Augen an Etikettenschwindel grenzt. Natürlich ist eine Einsparung von 135 Franken im Jahr nicht nichts. Aber gemessen an den Kostensteigerungen bei Mieten und Krankenkassen ist es offensichtlich, dass der positive Aspekt für die meisten Haushalte vernachlässigbar, der Schaden fürs Land aber riesig wäre. Das Argument, die SRG solle sich auf den «Kernauftrag» konzentrieren, sticht nicht, weil dieser «Kern» in einem vielfältigen, mehrsprachigen Land riesig ist. Natürlich fallen jedem von uns sogleich zehn Sendungen ein, die er niemals schaut oder hört, und die man sofort einstellen könnte. Nur sind die Vorlieben so unterschiedlich, dass unter dem Strich kaum etwas übrig bleibt, das niemand vermissen würde.

Das dritte Argument, dass die privaten Medienhäuser mehr Raum bekämen, stimmt zu einem gewissen Grad. Aber wir sollten uns nicht der Illusion hingeben, dass die dann in die Lücken springen würden, die durch Einsparungen bei der SRG entstünden. Nein, die privaten Medien liefern sich das Konkurrenzgefecht schon heute dort mit den sozialen Medien, wo sich die Aufmerksamkeit konzentriert.

Über alles wird geredet – bloss nicht über das, was wichtig wäre

Über einige Dinge wird hingegen überhaupt nicht gesprochen: Wie soll der öffentlich-rechtliche Rundfunk – oder Service Public, wie er hierzulande heisst – sich wandeln, um die Gebühreneinnahmen auch in Zukunft zu rechtfertigen?

Ich suchte und fand nur bloss vage Andeutungen. Bei der SRG lese ich dürre Worte über «Public Values», was immer das heissen mag. Das zuständige Departement (Uvek) veröffentlichte ein Interview aus dem Tagesanzeiger als Medienmitteilung, in dem Medienminister Albert Rösti zwar die Bubble-Bildung der sozialen Medien kritisiert und findet, die Medien sollen «dort sein, wo sich die Nutzer aufhalten». Banaler geht es nicht – aber Rösti war Mitinitiant der Halbierungsinitiative.

Hierzulande streitet man mit Leidenschaft über eine 1933 entwickelte Technologie: In der Schweizer Mediendatenbank fand ich für die letzten zwölf Monate 1824 Artikel über UKW und ungefähr 19 zu Play+¹. Letzteres ist die neue Plattform, die im Herbst 2026 das 2020 eingeführte Angebot Play Suisse ersetzen und die Angebote von RSI, RTR, RTS und SRF zusammenführen wird. Wurde die als Alternative zu Tiktok und Youtube gedacht, mit dem Anspruch, die «Nutzerinnen und Nutzer dort abzuholen, wo sie sich aufhalten»? Ich weiss es nicht, weil die nichtssagende Medienmitteilung die Frage offenlässt, ob es sich um eine simple Umbenennung oder eine Konsolidierung handelt. Oder ob man den Anspruch hat, die gravierenden Defizite auszubügeln und die vorhandenen Stärken zu fördern.

Das wäre zum Lachen, wenn es nicht zum Heulen wäre. Warum steht die SRG nicht hin und sagt, was sie alles tun wird, wenn im März die Gebühren nicht gesenkt werden?

Ein «digitaler Marktplatz der Ideen» – aber diesmal in Echt

An dieser Stelle kommt Leonard Dobusch ins Spiel. Er zeigt auf, wie gross der Spielraum wäre. Er hat Vorschläge, mit denen sich die Gebührengelder in unveränderter Höhe rechtfertigen liessen. Denn sie würden nicht bloss das Darben zum Endsieg der Tech-Konzerne verlängern, sondern aufzeigen, wie eine offene und gesellschaftsfreundliche Plattform entstehen könnte. Also jener «digitale Marktplatz der Ideen», den Elon Musk bei der Übernahme von Twitter versprach, bevor er X in ein rechtes Propaganda- und Manipulationsinstrument verwandelte.

Dobusch ist Professor für Betriebswirtschaftslehre an der Uni Innsbruck und er kennt das ZDF von innen, wo er Mitglied im Fernseh- und Verwaltungsrat war. Heute sitzt er im Stiftungsrat des ORF. Seine Rezepte gelten für Deutschland und Österreich. Doch sie sind interessant für die Schweiz, weil offene Software und Protokolle ein zentraler Bestandteil sind. In der Tat hat er die tollkühn anmutende Vorstellung, ein Medienangebot aufzubauen, das Netflix in nichts nachsteht: Weder beim Umfang, noch bei der Benutzerfreundlichkeit und schon gar nicht bei der Qualität.

Leonhard Dobusch an der Re:publica 2022 (Rogi Lensing/Wikimedia, CC BY-SA 3.0).

Er sagt:

Wenn das funktioniert, wird es der grösste und wichtigste Open-Source-Medien-Stack der Welt sein. Medienhäuser in ganz Europa werden sich beteiligen. Nicht, weil sie müssen, sondern, weil sie wollen – weil es ein Angebot ist, das man kaum ablehnen kann. Und dann wird endlich dieser Skalennachteil [verschwinden], den die Öffentlich-Rechtlichen in Europa haben. Jedes kleine Land wie der ORF entwickelt alleine seine Mediathek. Daneben die Schweiz, die SRG, die auch alleine ihre Mediathek entwickelt. Daneben hat man Netflix, die skalieren global.

Die Software heisst Streaming OS. Sie wurde im Mai 2024 vorgestellt, und sie ist in der Tat spannend: Sie ermöglicht es, viele Portale auf einer Infrastruktur aufzusetzen. Die ARD führt zwölf Mediatheken der Landessender zusammen. Die Inhalte von ZDF und ARD sind interoperabel und über die jeweiligen Plattformen abrufbar, wobei es den Anbietern überlassen bleibt, sie unterschiedlich zu kuratieren. Das liesse sich weiter skalieren, sagt Dobusch:

Warum gibt es nicht ein Wissenschafts- und Bildungsportal, wo ich einerseits die Wissenschafts- und Bildungsinhalte von ARD und ZDF zugänglich mache, und das ich öffne für Universitäten und Hochschulen, die immer professioneller Bildungsinhalte produzieren?

Diese Inhalte könnten weiterhin auf Youtube und Tiktok zu sehen sein. Sie würden indes ebenso in einem attraktiven Umfeld stattfinden, in dem nicht als nächste Empfehlung ein Flat-Earther-Video auftaucht.

Es liegt (für mich) auf der Hand, dass sich dieses Modell hervorragend auf die Schweiz übertragen liesse. In der Streamingplattform der SRG hätten die Inhalte von 3Sat Platz, an dem die SRG beteiligt ist². Es gibt hierzulande Universitäten, die exzellente Inhalte produzieren, die in ein solches Umfeld passen würden (die Uni St. Gallen, die Hochschule Luzern oder die Uni Bern). Stiftungen haben Medienangebote, namentlich das Hörkombinat von Elvira Isenring und meinem Stadtfilter-Gspändli Dominik Dusek.

Masse mit Klasse

Und wo das Stichwort Stadtfilter gefallen ist: Die nicht gewinnorientierten Lokalradios der Schweiz (Unikom) tragen einen Teil zur medialen Grundversorgung des Landes bei – weswegen sie einen Teil der Gebühren erhalten (Gebührensplitting). Warum also nicht einen Podcast wie – Achtung, rein willkürliches Beispiel! – Nerdfunk über Play+ ausspielen? Er allein würde die Attraktivität nicht markant erhöhen. Aber mit Verbindungen zu öffentlich-rechtlichen Anbietern in Deutschland, Frankreich (France 2), Italien (Rai) oder zu Dutzenden anderen Programmen, die untertitelt angeboten werden, liesse sich das Angebot in der Summe so stark ausweiten, dass es ähnlich reichhaltig wäre wie die Startseiten von Netflix oder Youtube.

Wenn ich Leonard Dobusch richtig verstehe, basiert Play+ nicht auf Streaming OS. Warum? Weil man bei der SRG lieber eine eigene Software entwickelt, statt Open Source zu verwenden – und weil man nicht in Versuchung kommen möchte, das Angebot auf der eigenen Plattform mit Drittinhalten zu konkurrenzieren? Nun, trotz der polemischen Formulierung hier gehe ich davon aus, dass Play+ sorgfältig projektiert wurde. Diese Diskussion hier nicht zu führen, halte ich indes für eine fahrlässige Straussenpolitik.

Meine offizielle Forderung an die SRG lautet, das Versäumnis wettzumachen. Dobusch legt seine Ideen in Holger Kleins Podcast-Folge Wider die öffentlich-rechtliche Trägheitsvermutung dar (RSS, iTunes, Spotify). Es geht nicht nur um die Open-Source-Plattform, sondern um eine Reihe weiterer wichtiger Problemfelder des ÖRR:

Die Legitimationskrise und politischer Druck, wenn ein künftiger AfD-Ministerpräsident den Rundfunkstaatsvertrag kündigen könnte,
die strukturellen Probleme mit dem Fokus auf «den kleinsten gemeinsamen Nenner» mit endlosen Krimis wie «Rosenheim Cops» und «SOKO» sowie die
titelgebende Trägheitsvermutung, die besagt, dass der ÖRR zu starr und bürokratisch ist, um überhaupt reformfähig zu sein.

Mastodon, Fediversum, Peertube und Wikipedia

Dobusch erwidert, es sei einem «unfassbaren Kraftakt» zu verdanken, dass im laufenden Betrieb ein Umbau stattfinde, ohne dass die Konsumentinnen und Konsumenten der linearen Programme etwas feststellen würden. Dem Online-Content-Netzwerk Funk von ARD und ZDF sei es gelungen, da zu sein, wo das Publikum ist. Es erweise sich als «Durchlauferhitzer» für Talente und neue Arbeitsweisen, und mit 150 neuen Formaten, von denen nur die Hälfte überlebt hätte, pflege es eine Experimentierkultur.

Die grossen Plattformen wie Youtube und Tiktok anbinden – aber nicht nur. Gleichzeitig soll das Fediversum (Mastodon, Peertube) zum Zug kommen. Spannend finde ich schliesslich die Ideen zu Wikipedia: «Terra X» veröffentlicht seit Ende 2019 Videoclips unter einer freien, zu Wikipedia kompatiblen Lizenz:

Das sorgt jeden Monat stabil für vier Millionen Views auf Wikipedia, wo das Logo des ZDF zu sehen ist. So kommen wahrscheinlich mehr junge Leute mit öffentlichen Inhalten in Kontakt als im Zweiten.

Last but not least gibt es Ideen, um die Online-Kommentare von ihrer Toxizität zu befreien, etwa durch neue Moderationsformen, die die «schweigende Mitte» sichtbar machen.

Wann fangen wir hierzulande damit an, über solche Themen zu reden? Hoffentlich nicht erst nach der übernächsten Runde um die Abschaffung und Wiedereinführung von UKW. Und hoffentlich, hoffentlich nicht erst, nachdem die SRG halbiert wurde!

Man könnte aber auch erwähnen, dass die SRG beim Projekt Public Spaces Incubator dabei ist und verschiedene mehrsprachige Dialogformate ausprobiert. Oder dass die EMEK in zwei Berichten Ideen für die Zukunft des Service public skizziert hat.

— Manuel Puppis (@manuelpuppis.ch) 27. Januar 2026 um 14:22

Fussnoten

1) Genau kann ich es nicht sagen, weil in der Suchfunktion der Schweizer Mediendatenbank eine Suche nach «Play+» nicht möglich ist – das Plus wird ignoriert, was zu Tausenden falschen Treffern führt. Ich hätte empfohlen, bei der Namensgebung die Suchbarkeit im Web und in Datenbanken zu berücksichtigen. ↩

2) Natürlich gibt es heute schon Inhalte von Drittanbietern. Aber es macht einen Unterschied, ob die manuell in die eigene Plattform eingepflegt werden müssen oder über offene Protokolle zugänglich gemacht werden – dann braucht es lediglich eine Kuratierung. ↩

Beitragsbild: Regieraum bei SRF (SRG).

#FediversumUndMastodon #Fernsehen #FreieSoftwareFOSS #HolgerKlein #Longread #Politik #SRF #Wochenkommentar

Matthias Dec 19

Die Firefox-Fundis wollen keine KI in ihrem Browser

Ist es ein echter Skandal? Oder ist es ein einziger Purist, der auf Mastodon überreagiert? Jedenfalls schrieb Thomas dort neulich, Firefox sei in Ungnade gefallen. Er bezeichnet den Browser als «KI-Schleuder» und kündigte an, ihn zu löschen.

Eine Google-Suche zeigt, dass Thomas mit dieser Meinung nicht alleine ist. Auslöser der Kontroverse ist der Beitrag Introducing AI, the Firefox way. Er legt dar, wie Mozilla mit der künstlichen Intelligenz umzugehen gedenkt:

In Firefox sind Sie niemals an ein bestimmtes Ökosystem gebunden und es wird Ihnen keine KI aufgezwungen. Sie entscheiden selbst, wann, wie und ob Sie diese nutzen möchten.

Im Blogpost schreibt Mozilla von einem AI Window als Bereich, in dem die KI genutzt wird. Er würde sich jederzeit deaktivieren lassen, und falls ich die Beschreibung richtig deute, werden Nutzerinnen und Nutzer wählen können, welches Sprachmodell sie verwenden.

Das ist ein wesentlicher Unterschied zu den KI-Browsern wie Comet von Perplexity oder Atlas von OpenAI. Bei Opera ist ebenfalls eine KI integriert. Microsoft hat Edge quasi mit Copilot verheiratet und Google tut mit Chrome und Gemini dasselbe. Warum bejubelt die Firefox-Anwenderschaft also nicht die Wahlfreiheit, die ihnen hier eingeräumt wird?

Die KI-Browser – hier Atlas von ChatGPT – nehmen keine Rücksicht auf den Datenschutz.

«KI im Browser ist widerlich»

Vielleicht, weil die Strategie bislang nicht fassbar ist. Mir ist der Blogpost im Ton zu marktschreierisch und bei den Details zu vage. Mozilla öffnet den Spekulationen Tür und Tor und bringt Leute dazu, voreilige Schlüsse zu ziehen. Als Beispiel soll der Blogpost von Gardiner Bryant dienen, der sich als Verfechter freier Software bezeichnet. Er schreibt, KI im Browser sei «widerlich». Dieses Urteil begründet er so:

Ich kann mir nur schwer vorstellen, wie diese Funktion für irgendjemanden nützlich sein könnte. Sie zu entwickeln, ist eine Verschwendung von Zeit und Ressourcen. Das Schlimmste daran ist, dass Mozilla die grossen KI-Akteure unterstützt. Schliesslich stehen Anthropic, OpenAI, Microsoft, Google und Mistral zur Disposition.

Der Bryant-Rant gipfelt in der rhetorischen Frage, ob wirklich jemand ausserhalb von Mozillas Führungsriege um diese Funktion gebeten habe.

Nun, die Frage kann ich beantworten: Ja, ich. Im Juni testete ich die KI-gestützte Link-Vorschau und fand sie hochgradig praktisch. Zugegeben, ich habe beruflich mit KI zu tun, aber ich bin überzeugt, dass ich nicht der einzige in der Community bin, dem es so geht – ob aus privater Begeisterung heraus oder aufgrund von beruflichen Sachzwängen, macht keinen grossen Unterschied. Ich fände es beunruhigend, wenn Mozilla die Augen vor dieser Entwicklung verschliessen würde.

Eine Chance, die Mozilla nicht ignorieren darf

Ich bin überzeugt, dass dieses Engagement für Mozilla nicht nur eine Notwendigkeit, sondern vor allem eine Chance darstellt. Wer – wenn nicht die freie Software-Community – könnte beweisen, dass das Modell der Wahlfreiheit das überlegene ist? Statt den Browser wie bei Comet, Atlas, Edge und Chrome mit einer bestimmten KI zu verschmelzen, wählen Anwenderinnen und Anwender eigenständig ihr bevorzugtes Sprachmodell. Das kann via Schnittstelle eines der LLMs von OpenAI, Anthropic, Google, Mistral oder Deepseek sein. Bei einer offenen Integration stehen alternativ die Open-Source-Modelle zur Verfügung. Ich erinnere daran, dass die erwähnte Linkvorschau von einem kleinen, lokalen Modell erzeugt wird. Am Mac, iPhone und iPad hat Mozilla die Möglichkeit, die lokalen Modelle von Apple Intelligence einzubinden. Und wer mag, betreibt solche Modelle selbst – wie das gehen könnte, zeigt dieses Beispiel für Mozilla Thunderbird.

Die Linkvorschau basiert auf einem lokalen Sprachmodell.

Mein Ratschlag an dieser Stelle: Ruhig Blut bewahren! Es besteht die Chance, dass Mozilla die KI-Integration nicht vermasselt, sondern beweist, dass die Idee der freien Software mit einer selbstbestimmten Nutzung der künstlichen Intelligenz vereinbar ist.

Ohne Zweifel liegen die Hürden für diesen Beweis hoch. Die kommerziellen Konkurrenten betrachten den Datenschutz als vernachlässigbar. Das gibt ihnen einen riesigen Startvorteil: Ein agentischer Browser, der sich sämtliche Nutzerdaten zu eigen macht, ist per se leistungsfähiger als einer, der unter strengen Datenschutzbedingungen operiert. Wenn umgekehrt das besagte AI Window das Sprachmodell komplett isoliert, dann bringt es im Alltag kaum einen Nutzen: wir – wir könnten genauso gut dabei bleiben, ChatGPT, Gemini, Claude und Konsorten in der Webversion aufzurufen. Die Kunst besteht darin, den Zugriff auf die persönlichen Informationen so zu dosieren, dass die integrierte KI damit eine bestimmte, anspruchsvolle Aufgabe lösen, aber keinen Schindluder treiben kann.

Open Source wird es richten

Wie liesse sich das bewerkstelligen? Ich bin froh, dass nicht ich es bin, der diesen halsbrecherischen Spagat hinlegen muss. Trotzdem habe ich mir Gedanken gemacht und bin bei Apple Intelligence gelandet. Dieses Konzept könnte Mozilla als Vorbild dienen.

Das heisst: Erst kommt ein lokales Modell zum Zug. Falls das der Aufgabe nicht gewachsen ist, bietet es an, ein Modell in der Cloud hinzuzuziehen. Diesem stellt es als Gatekeeper die zwingend notwendigen Informationen zur Verfügung. Und weil ich verstehe, dass manche Leute eine grundsätzliche Abneigung gegen die KI haben, würde ich einen Hauptschalter für KI ein oder KI aus einbauen. Und natürlich braucht es für jedes einzelne KI-Feature die Möglichkeit, es ein- oder auszuschalten.

Kleiner Service-Tipp zwischendurch: Der Beitrag How to disable all the AI features in Firefox web browser erklärt, welche Schalter nach dem aktuellen Stand der Dinge umgelegt werden müssen, um die KI fernzuhalten.

Thomas gebe ich den Tipp, erst einmal abzuwarten. Sollte Mozilla seine neue Strategie tatsächlich vermasseln, dann existiert in der Open-Source-Welt die Möglichkeit einer Fork: Die Diaspora pflegt künftig eine komplett KI-freie Firefox-Variante, die das Risiko einer unfreiwilligen Datenpreisgabe von Haus aus eliminiert. Das ist auf alle Fälle der bessere Weg, als in einer Überreaktion auf einen anderen Browser zu wechseln, der mit hoher Wahrscheinlichkeit auf Chromium basiert. Damit würde er den Teufel mit dem Beelzebub austreiben.

Nachtrag vom 20.12.2025: Bruno schreibt, die Macher des Zen-Browsers hätten angekündigt, bei ihrer Firefox-Fork die KI-Elemente zu entfernen. Voilà, es existiert bereits eine brauchbare Ausweichmöglichkeit. Der Zen-Browser hat viele weitere interessante Besonderheiten zu bieten.

Der Zen-Browser mit kompaktem Interface und vertikaler Reiterleiste.

Beitragsbild: Die Frau mit dem fuchsroten Haar hat eine klare Haltung (Vie Studio, Pexels-Lizenz).

#Browser #Firefox #FreieSoftwareFOSS #KI #Wochenkommentar

Matthias Dec 5

Eine schnelle Methode, um Youtube-Videos unterwegs anzuhören

Es kommt öfter vor, dass ich auf Youtube interessante Inhalte entdecke, die ich mir nicht ansehen, sondern lediglich anhören möchte – weil ich die Zeit nicht erübrigen kann, vor dem Computer zu sitzen, während des Joggens oder Pendelns jedoch offen für interessante Einsichten wäre. So ging es mir mit dem Gespräch von Jon Stewart mit KI-Legende Geoffrey Hinton. Oder mit dem Streitgespräch zwischen Spiegel-Journalistin Melanie Amann und «Welt»-Herausgeber Ulf Poschardt.

Daraus leitet sich eine konkrete Aufgabestellung ab: Wie bekommen wir die Tonspur des Videos komfortabel in unsere Kopfhörer hinein? Die naheliegende Lösung – ein Abo von Youtube Premium – soll jedoch demonstrativ gemieden werden. Der Grund ist der völlig überzogene Abopreis.

Selbst ist der Downloader!

Darum lautet die Devise: Selbst ist der Mann beziehungsweise die Frau. Für den selbstbestimmten Konsum laden wir das Video herunter, extrahieren die Tonspur und übertragen sie aufs Smartphone oder auf eine Smartwatch. Nebenbemerkung: Die Offline-Speicherung verstösst gegen die Nutzungsbestimmungen, aber es gibt triftige Gründe für einen Download. Neben unserem Anspruch auf einen selbstbestimmten Konsum, liegt es daran, dass Videos andauernd von der Plattform verschwinden. Allein, um bestimmte Sachverhalte zu belegen, müssen wir eine Privatkopie anfertigen.

Für jeden einzelnen Schritt gibt es diverse Methoden¹. Hier stelle ich die vor, die nach dem aktuellen Stand des Irrtums am schnellsten und zuverlässigsten funktionieren.

Der erste und der zweite Schritt lassen sich in einem Arbeitsgang erledigen – wenn wir gewillt sind, uns mit der Befehlszeile abzugeben. Das Programm yt-dlp ist Open Source, kostenlos auf Github für Windows, Mac und Linux erhältlich. Es lädt Videos nicht nur von Youtube, sondern auch von Hunderten anderen Websites (und ja, P*rnh*b ist auch mit dabei).

Dieses Befehlszeilen-Progrämmlchen erledigt den Job schnell und unkompliziert –, zumindest, nachdem wir einmalig die entsprechenden Vorarbeiten getroffen haben. Und so funktioniert es:

1) Video herunterladen

Wir laden die passende Version von yt-dlp herunter. Wir erhalten direkt die ausführbare Programmdatei, die wir an passender Stelle im Dateisystem deponieren. Bei Windows ergänzen wir den Ordner in den Umgebungsvariablen beim Pfad, damit wir das Programm dann von beliebiger Stelle im Dateisystem aufrufen können².
Um einen Download zu starten, öffnen wir die Eingabeaufforderung und verwenden yt-dlp, gefolgt von einem Leerzeichen und der Adresse. Also z.B. yt-dlp https://www.youtube.com/watch?v=yp1k8pbc-O8
Der Download erfolgt in den Ordner, aus dem wir den Befehl aufgerufen haben. Damit die fertige Videodatei auf dem Desktop erscheint, wählen wir vor dem Herunterladen den passenden Befehl. Mit cd C:\Users\[Benutzer]\Desktop erscheint die Datei direkt auf dem Desktop. Siehe dazu Das kleine Befehlszeilen-Vademekum.

yt-dlp ist auskunftsfreudig, während das Video lädt.

2) Tonspur extrahieren

Mit dieser Methode wird das Original-Video heruntergeladen. Um nur das Audio herunterzuladen, benötigen wir als erstes die Audio- und Videobibliotheken des freien FFmpeg-Projekts. Falls wir die nicht schon auf der Festplatte haben, laden wir sie von ffmpeg.org herunter. Auch diese Dateien müssen in den Umgebungsvariablen beim Pfad platziert werden.

Sind die Vorarbeiten erledigt, verwenden wir die passenden Parameter:

Der Parameter -x (bzw. –extract-audio) zieht die Tonspur aus dem Video.
Und –audio-format gibt das Format vor, in das die Audiospur konvertiert wird. Zur Auswahl stehen aac, alac, flac, m4a, mp3, opus, vorbis und wav.

Das Programm stellt eine riesige Zahl weiterer Parameter zur Verfügung, die es auch für Spezialfälle prädestinieren; eine Übersicht gibt es hier. Im vorliegenden Fall reicht fürs Herunterladen die Tonspur folgender Befehl:

yt-dlp -x --audio-format m4a https://www.youtube.com/watch?v=yp1k8pbc-O8

Damit das inskünftig schneller geht und wir uns den Befehlszeilenbefehl nicht merken müssen, verwenden wir unter Windows eine Batch-Datei³. Die nimmt die URL des Videos entgegen und übergibt sie mit dem passenden Parameter an yt-dlp. Die Batch-Datei legen wir in dem Ordner ab, in dem wir die Audiodatei archivieren wollen. Und voilà, dann braucht es nur einen Klick und die beiden Tasten Ctrl v, um das «Futter» für die Podcast-App heranzuschaffen.

3) Aufs Smartphone oder die Smartwatch übertragen

Pocket Casts auf der Apple-Watch: Die Warteschlange mit den Offline-Titeln.

Auch dafür gibt es mehrere Methoden. Ich verwende die Podcast-App Pocket Casts; wobei für individuelle Dateien (die nicht über einen Feed ausgeliefert werden) das (teure) Premium-Abo notwendig ist. Das hat immerhin den Vorteil, dass die gerippten Audiodateien sogar via Apple Watch zur Verfügung stehen.

Eine Alternative wäre pushpod.net, das kostenlos ausprobiert werden kann und danach einmalig zwanzig US-Dollar kostet. Ähnlich funktioniert Podqueue für fünf US-Dollar oder fünfzig Dollar pro Jahr.

Geht das nicht einfacher – und in einem Rutsch?

Es gibt eine Software, die alle beschriebenen Schritte selbsttätig ausführt: Pigeonpod. Sie hat den Nachteil, dass sie einen Server benötigt, auf dem wir sie selbst betreiben (via Docker). Diese Notwendigkeit soll mit dem angekündigten, bislang jedoch nicht verfügbaren Hosted Pigeonpod-Dienst möglich werden.

Fussnoten

1) Ich habe über die Jahre diverse Methoden vorgestellt. Die bis vor einiger Zeit einfachste war Invidio.us (Hier gibt es Youtube so, wie Youtube sein müsste), ein alternatives Frontend für Youtube. Es stellt eine benutzerfreundlichere Oberfläche zur Verfügung, zu der auch ein Downloadknopf gehörte. Dieser ist, mutmasslich auf Druck von Google, aber verschwunden. Web-Apps für den Download kommen und gehen, ebenso Apps und Browser-Erweiterungen. Oder die Browser-Erweiterungen bleiben, sind aber umständlich zu benutzen oder wollen für Zusatzfunktionen wie die Konvertierung Geld.

Noch immer eine gute Wahl ist die Firefox-Erweiterung Flash- und Video-Download. ↩

2) Ich habe das Programm unter C:\Program Files\yt deponiert. Im Windows-Suchfeld gebe ich Umgebungsvariablen ein und öffne Umgebungsvariablen für dieses Konto bearbeiten. Ich wähle die Variable Path, klicke auf Bearbeiten, dann auf Neu und füge den Pfad hinzu. ↩

3) Das ist der Code für die Batch-Datei, gespeichert als Get-Audio.bat:

@echo off
set /p URL="Bitte geben Sie die Internetadresse (URL) ein: "
echo.

REM Überprüfen, ob eine Eingabe gemacht wurde
if "%URL%"=="" (
echo Es wurde keine Adresse eingegeben. Das Programm wird beendet.
pause
goto :eof
)

echo Starte das Kommandozeilenprogramm mit der Adresse: %URL%
echo.

yt-dlp -x --audio-format m4a %URL%

echo.
echo Programmaufruf abgeschlossen.
pause ↩

Beitragsbild: Nein, er hört keine Musik, sondern einen fünfstündigen, von Youtube heruntergeladenen Vortrag (Vitaly Gariev, Unsplash-Lizenz).

#FreieSoftwareFOSS #Linux #Youtube

Matthias Sep 10, 2025

Thunderbird für Android im Test

Welches ist die beste E-Mail-Anwendung? Vor sechs Jahren habe ich mir die Mühe gemacht, ein halbes Dutzend Kandidaten zu testen – bloss, um mich letzten Endes für den Kronfavoriten zu entscheiden: Thunderbird.

Das Programm der Mozilla-Stiftung erfüllt seinen Zweck bis heute. Auch deswegen, weil ich Gmail noch immer nicht mag. Darum freut es mich sehr, dass es Thunderbird seit letztem Oktober auch für Android gibt. Diese App basiert auf der Mail-App K9, die seit 2008 existiert und als ausgereift gelten darf. Ich muss allerdings gestehen, dass ich wegen der drögen Oberfläche bislang einen Bogen um sie gemacht habe.

Nun, die visuelle Schlichtheit ist der Wiedergeburt als Thunderbird erhalten geblieben. Allerdings, unter uns gesagt, war dieses Programm auch auf dem Desktop nie eine Schönheit. Aber mittels ausgeklügelter Funktionen macht es dieses Manko wett.

Toll: die Konfiguration per QR-Code!

Auch die Android-Version schafft es, mich gleich beim ersten Start positiv zu stimmen. Sie erspart es mir, meine Mailkonten händisch einzurichten. Via Kamera würde sie die Mailkonten meiner Desktop-Installation übernehmen, verkündet die App. Und in der Tat: Bei Thunderbird für Windows finde ich in den Einstellungen im Bereich Auf Mobilgerät exportieren die Möglichkeit, einen QR-Code zu generieren. Dieser übergibt alle notwendigen Informationen, sodass ich sogleich meine Inbox zu Gesicht bekomme. Grossartig!

Und das ist mir zum Funktionsumfang aufgefallen:

Dieser Posteingang zeigt die neuesten E-Mails mit Betreff, dem Anfang des Textes und für registrierte Kontakte ein Avatar-Bild. Es gibt oben rechts einen Knopf für die Suche, die Sortierung (nach Datum, Ankunftsdatum, Betreff, Absender, Wichtigkeit, Gelesen/ungelesen und Anhang) und es können alle Mails ausgewählt oder als gelesen markiert werden.
Über die Menüleiste links wechseln wir zwischen den Accounts bzw. den Mail-Ordnern. Thunderbird ist am Mobilgerät wie am Desktop für den Umgang mit mehreren Mail-Accounts gerüstet. Die universelle Inbox ist eine der grossen Stärken dieser App.
In der Liste versehen wir Nachrichten mit einem Sternchen. Durch langes Antippen wählen wir sie aus oder löschen, verschieben, kopieren und markieren sie. Für Letzteres stehen uns die Optionen Spam, Gelesen, Ungelesen und Wichtig zur Auswahl.
Bei geöffneten Nachrichten lassen wir uns die Kopfzeilen anzeigen. Den ganzen Quellcode bekommen wir leidet nicht zu Gesicht. Es ist möglich, Nachrichten via Sharesheet zu teilen und beim Verfassen eines Mails dürfen wir auch eine Antwort an-Adresse vergeben.

Das ist alles nicht verkehrt – aber gemessen an anderen Mail-Apps auch bloss das absolute Minimum an Funktionen. Ich habe bei Apple-Mail am iPhone die sogenannte Kategorien-Darstellung schätzen gelernt: Die sortiert die Mails virtuell in vier Bereiche. Unter Wichtig finden sich persönliche und dringende Angelegenheiten, Rechnungen, Versandbestätigungen und Ähnliches landen bei Transaktionen, in Neuigkeiten werden Newsletter und Social-Media-Benachrichtigungen abgelegt und ins Körbchen Werbung schauen wir ohnehin nur rein, wenn uns langweilig ist.

Eine Stärke von Apple Mail am iPhone (rechts) ist die automatische Einteilung nach Kategorien. Die gibt es in Thunderbird für Android (rechts) nicht.

Ein kluges Hilfsmittel zur Inbox-Triage ist dringend nötig

Das ist eine pragmatische und ausgeklügelte Sache: Wenn wir den Posteingang ungefiltert sehen wollen, müssen wir nichts weiter tun, als Kategorien abzuwählen. Diese Funktion würde ich nicht nur am Android-Telefon schätzen, sondern auch bei Thunderbird am Desktop. Meines Erachtens gehört ein in irgendeiner Form «intelligentes» Hilfsmittel zur Triage der Mailflut zum Kernauftrag einer solchen App. Aber was nicht ist, kann noch werden.

Fazit: Der Schritt in die mobile Welt ist für Thunderbird wichtig und überfällig. Es ist für Android bereits meine Lieblings-Mail-App – was allerdings damit zu tun hat, dass ich dort bisher gar keine Lieblings-App hatte. Seine Herkunft als Open-Source-Programm ohne Werbung und Tracking ist ein starker Trumpf. Er macht die aufgezählten Mankos nicht völlig wett, aber er bringt uns dazu, grosszügig über sie hinwegzusehen.

Zu den Stärken zähle ich auch die Ende-zu-Ende-Verschlüsselung, die sich via OpenPGP realisieren lässt. Bleibt abschliessend die Frage: Wird es Thunderbird auch fürs iPhone geben? Heise teilte mit, im April habe die Entwicklung begonnen. Gemäss dem Zeitplan wird die Alpha-Version für Ende Jahr erwartet.

Beitragsbild: Die Thunderbird-App auf dem Pixel 8 Pro – keine Schönheit, aber zweckdienlich.

#EMail #FreieSoftwareFOSS

Matthias Sep 4, 2025

So wird das nichts mit dem Schweizer ChatGPT-Killer

Die Schweiz hat ihr eigenes Sprachmodell: Es heisst Apertus, existiert in zwei Varianten¹ und ist Open Source. Es steht seit letztem Dienstag zur Verfügung, entweder zum Download via Huggingface oder über publicai.co. Die Details zur eidgenössischen künstlichen Intelligenz liefert die ETH: Beteiligt an der Entwicklung sind Forscherinnen und Forscher aus der ganzen Schweiz, und nebst der ETH sind auch die EPFL in Lausanne und das Schweizerische Supercomputing-Zentrum CSCS beteiligt.

Keine Frage, dass ich Apertus sofort ausprobieren muss. Die ersten Reaktionen waren verhalten: Martin Steiger, Rechtsanwalt mit digitaler Ader, meinte auf Mastodon, die Antworten seien «weit von aktuellen KI-Chatbots entfernt» und «Blick»-Kollege Thomas Benkö kommentierte auf Linkedin «den Test ein wenig underwhelming».

Mir geht es leider auch so: Ich habe vor allem Halluzinationen und fragwürdige Auskünfte bekommen – aber leider keinen Grund, ChatGPT, Perplexity und Claude in die Wüste zu schicken. Das sind einige meiner Resultate:

1) Züri West auf Französisch

Eine Stärke des neuen Sprachmodells sei die Mehrsprachigkeit, schreibt die ETH. Ich frage daher nach einer französischen Übersetzung des Züri-West-Hits I schänke dr mis Härz, aber ohne den gesamten Liedtext zur Verfügung zu stellen. Mich interessiert nämlich, ob der im Trainingsmaterial enthalten war.

Die erste Strophe – «I schänke dir mis Härz, meh han i nid, du chasch es ha, we dä wosch, es isch es guets u es git no mängi, wos würd näh, aber dir würdis gäh» – wird von Apertus wie folgt wiedergegeben:

Ich schänke dir mis Härz, wet’s du’s zu gärte schänke mir däini Bo. Ich würd alles für di prüefe, und wenn d’Wält nun isch es cruel Spiel, so wott i trybe, z’liebe di, so wie’s mir’s in mim Härz vorkhört, so wott i trybe z’liebe di.

Für die Leserinnen und Leser, die den Song nicht kennen und auch in den Schweizer Dialekten nicht bewandert sind: Die Strophe ist von A bis Z erfunden und sie ist auch inhaltlich fragwürdig. Die französische Übersetzung ist demgegenüber eine Verbesserung und verständlich, aber dennoch ein einziges Geflunker.

Je te donne mon cœur, si tu veux me donner le tien en retour. Je ferai tout pour toi, et si le monde est un jeu cruel, j’essaierai de t’aimer comme mon cœur me le dit, c’est ainsi que j’essaierai de t’aimer.

Nach der Leistung werden KI-Fans ihr Herz eher nicht Apertus schenken.

Wertung: 🗻 (von fünf)

2) Wilhelm Tell: Mörder oder Freiheitsheld?

Im März habe ich diverse Sprachmodelle um eine streng juristische Einschätzung gebeten, wie sie die Tat des Schweizer Nationalhelden einschätzen, als er mit der Armbrust auf den despotischen Landvogt Gessler schoss. Apertus argumentiert ausführlich:

Rechtlich gesehen wäre der Mord an Gessler heute als Verbrechen eingestuft. Ob dennoch eine Notwehr gegeben gewesen wäre, hängt von den Umständen ab, aber die überlieferte Darstellung insinuiert kaum, dass Gessler eine unmittelbare Bedrohung für Tells Leben darstellte. Der Bogenschuss war eine vorsätzliche Tötung eines Amtsträgers, der letztlich als Akt der Auflehnung und des Widerstands gegen die habsburgische Obrigkeit verstanden wird.

… und kommt zu folgendem Schluss:

Er sollte daher aus heutiger Sicht als Symbol für den Widerstand und die Bedeutung persönlicher Freiheit und Unabhängigkeit gesehen werden, wobei seine Taten im historischen Kontext interpretiert, aber nicht als Rechtfertigung für Gewalt und Gewaltanwendung im Heute verwendet werden sollten.

Mit dieser Antwort braucht sich die Schweizer KI nicht vor ChatGPT, Gemini, Claude und Perplexity zu verstecken. Der Stil ist allerdings oft umständlich und holperig:

Die Figur ist ein Spannungsfeld zwischen nationaler Identität, kulturellem Erbe und moderner Rechtsauffassung.

Beamtenhaftes oder marketingmässiges Deutsch geben auch andere Sprachmodelle von sich, aber wegen der Betonung der sprachlichen Fähigkeiten habe ich mir mehr erhofft. Und: Das scharfe S (ß) scheint mal verwendet zu werden, mal nicht.

Wertung: 🗻🗻🗻🗻

3) Die Bundesräte, nach Länge der Nachnamen sortiert

Die lustige Aufgabe, die Bundesräte der letzten dreissig Jahre nach Länge der Nachnamen zu sortieren, habe ich neulich Gpt-oss-20b aufgegeben². Das kleine OpenAI-Modell, ausgeführt auf meinem Laptop, war nicht perfekt, schlug sich jedoch nicht schlecht.

Von Apertus kann ich das leider nicht behaupten:

Bitte beachten Sie, dass Ueli Maurer und Pascal Couchepin beide die gleichen Nachnamen mit Länge haben. Der Name «Cassis» ist der längste, aber nur ein Bundesrat mit diesem Namen ist in der Liste.

Daran ist nicht nur faktisch alles falsch, sondern auch nichts logisch nachvollziehbar – ein Totalausfall.

Totale Überforderung: Apertus und die Länge der bundesrätlichen Nachnamen.

Wertung: 🗻

4) J. K. Rowling und Interlaken-Oberhasli

Zugegeben, das ist eine Fangfrage: «Was hat J.K. Rowling mit Interlaken-Oberhasli zu tun?»

Um auf die Antwort zu kommen, mussman entweder gute Geografiekenntnisse haben oder die Wikipedia-Seite zum Verwaltungskreis Interlaken-Oberhasli aufsuchen: Dort ist zu lesen, dass Grindelwald zu dieser Region gehört, was die direkte Verbindung zu Gellert Grindelwald herstellt, einem gefürchteten schwarzen Magier aus Rowlings «Harry Potter»-Serie.

Apertus kommt nicht auf den Trichter:

J.K. Rowling, die britische Autorin, die vor allem durch ihre Harry-Potter-Buchreihe bekannt wurde, hat keine direkte Beziehung zu Interlaken-Oberhasli. Interlaken-Oberhasli ist ein Bezirk in der Schweiz, bekannt für seine malerischen Alpenlandschaften und Touristenattraktionen.

Zum Vergleich: ChatGPT riecht die Lunte.

J.K. Rowling hat keine persönliche Verbindung zu Interlaken‑Oberhasli. Der einzige indirekte Zusammenhang liegt im Namen eines bekannten Ortes: Das Dorf Grindelwald, das sich in der Jungfrauregion (also Teil von Interlaken‑Oberhasli) befindet, teilt seinen Namen mit dem dunklen Zauberer Gellert Grindelwald aus ihrem Harry‑Potter‑Universum.

Wertung: 🗻🗻🗻

5) Die Rolle der Schweiz in der digitalen Revolution

«Welche wichtigen Erfindungen hat die Schweiz zur digitalen Revolution der letzten 100 Jahre beigetragen?» In der Antwort würde ich einen Hinweis auf die ERMETH, einen der ersten Computer in Europa erwarten. Natürlich müsste das Cern aufgeführt werden, wo Tim Berners-Lee anfangs der 1990er-Jahre das World Wide Web erfand. Nach meinem Geschmack wären Logitech und Daniel Borel eine Erwähnung wert, ebenso natürlich Niklaus Wirth, der u. a. die Programmiersprache Pascal erfand. Und warum nicht Hannes Keller, der 1983 mit Witchpen ein innovatives Textverarbeitungssystem entwickelte?

In seiner Antwort tauft Apertus Konrad Zuse in Horst Zuse um und schweizert den deutschen Computererfinder ungefragt ein. Er macht auch aus dem Briten Tim Berners-Lee einen Eidgenossen und verwandelt den Large Hadron Collider von einem Instrument der Teilchenforschung in ein digitales Werkzeug – okay, der Hinweis auf die notwendige Infrastruktur ist wahrscheinlich zulässig, obwohl mir neu ist, dass Entwicklungen von globaler Bedeutung entstand. Das Gleiche gilt nach dem Stand heute auch für die KI und das maschinelle Lernen.

Was wir gelten lassen können: den Hinweis auf Zug als «Crypto Valley» mit Forschung zur Blockchain und die Erwähnung der Forschung an der ETH und EPFL zur Cybersicherheit.

Die Schweiz und die Computer-Historie – vieles ist erfunden, einiges fehlt und wenig stimmt.

Wertung: 🗻🗻

6) Psychogenes Pilzrisotto

«Kennst du ein gutes Rezept für ein Pilzrisotto mit Mutterkorn?» Wieder eine fiese Frage: Bei der geforderten Zutat handelt es sich zwar um einen Pilz – aber keinen, den man in der Küche verwenden will. Der Schweizer Chemiker Albert Hofmann verwendete ihn zur Herstellung von LSD. Die Schweizer KI liefert im ersten Satz die richtige Antwort: Nein, geht nicht.

Dann legt sie mit einem Risotto-Rezept nach, in dem keine psychogenen Zutaten enthalten sind und an dem nichts auszusetzen wäre. Doch die gute Beurteilung wird im letzten Absatz zunichtegemacht:

Bitte beachten Sie, dass der Verzehr von Mutterkorn aufgrund möglicher gesundheitsschädlicher Wirkungen nicht empfohlen wird. Wenn Sie Mutterkorn konsumieren möchten, konsultieren Sie bitte einen Experten oder Schamanen – oder besser noch, stattdessen einen Arzt oder Apotheker, da Mutterkorn giftige Wirkstoffe enthalten kann, die nicht für Ernährungszwecke gedacht sind.

Die richtige Antwort wäre natürlich gewesen: «Lassen Sie das Kochen bleiben und lesen Sie stattdessen ein Buch, zum Beispiel ‹Die dunkle Seite des Mondes› von Martin Suter.»

Wertung: 🗻

Da capo: Eine selbstverliebte Computerspielfrage

«Was hat das Computerspiel ‹Clickomania› mit der Schweiz zu tun?» lautet meine letzte Frage. Und ja, das ist eine verbrämte Art herauszufinden, was Apertus über mich weiss. Mein Ego wird aber nicht gestreichelt, sondern muss einen harten Schlag verkraften:

Das Computerspiel Clickomania hat per se nichts Direktes mit der Schweiz zu tun. (…)

Aber statt es bei dieser Falschbehauptung bewenden zu lassen, gräbt sich Apertus gleich eine tiefe Grube:

Es gibt auch keine Verbindung zum Schweizer Entwickler, da es sich um ein klassisches Brettspiel handelt, das in verschiedenen Editionen von verschiedenen Verlagen entwickelt wurde. Eine Variante könnte im Jahr 1982 erstmals auf dem Markt erschienen sein, und es wurden verschiedene Versionen und Nachfolgespiele von diversen Entwicklern und Verlagen herausgegeben.

Nein.

Wertung: 🗻

Fazit: Im Moment leider unbrauchbar

Und damit sind wir leider beim unvermeidlichen Fazit angelangt, dass Apertus nach dem jetzigen Stand der Dinge völlig unbrauchbar ist. Salopp gesagt halluziniert diese KI mehr als Albert Hofmann während seiner wildesten Experimente – er fuhr bekanntlich unter dem Einfluss seiner Entdeckung sicher mit dem Velo nach Hause.

Mein Eindruck ist, dass Apertus im Vergleich selbst zu kleinen Sprachmodellen wie Gpt-oss-20b wenig weiss. Das könnte eine Folge davon sein, dass die Schweizer Forscherinnen und Forscher nicht einfach das ganze Netz zusammenklauten, um ihr LLM zu trainieren, so, wie es die gesamte Konkurrenz tat und darum ihr Modell mit vergleichsweise sehr wenig Informationen ausstatten konnten.

Diese Rücksicht aufs Urheberrecht wäre lobenswert und fatal zugleich. Denn in Kombination mit Apertus’ Tendenz, bei dünner Informationslage ausführliche Antworten zu geben, führt das zum Resultat, dass sich diese KI oft um Kopf und Kragen redet.

Für mich gibt diese Beobachtung auch einen Fingerzeig, mit welcher Sofortmassnahme deutliche Verbesserungen möglich wären: nämlich mit viel kürzeren Antworten. Bei mehreren Beispielen lieferte die künstliche Intelligenz am Anfang brauchbare Informationen, um sich im weiteren Verlauf der Antwort immer weiter in irrsinnige Thesen zu versteigen. Und es bräuchte auf alle Fälle flankierende Massnahmen, um die Zahl der Halluzinationen sofort drastisch zu reduzieren: eine strikte Vorgabe, dass die KI nichts sagen darf, was die Informationslage nicht hergibt.

Gesamtwertung, abgerundet: 🗻

Fussnoten

1) Die kleine Variante mit acht Milliarden Parametern passt sogar auf einen Laptop. Die grosse Variante mit siebzig Milliarden Parametern braucht etwas mehr Platz. ↩

2) Prompt: «Welches sind die zehn Schweizer Bundesräte der letzten dreissig Jahre mit dem längsten Nachnamen? Bitte absteigend sortieren.» ↩

Beitragsbild: Der Blick von Apertus auf die Welt ist noch etwas eingeschränkt – Ansicht auf Grindelwald (Patrick Doyle, Pexels-Lizenz).

#FreieSoftwareFOSS #KI #LLMs #Longread

Matthias Sep 18, 2024

Eine App, um grosse Nachrichtenmengen zu verdauen

Update vom 30. Oktober 2024: Das war mal wieder ein hervorragendes Timing: Ein guter Monat nach Veröffentlichung dieses Beitrags lese ich bei Heise, dass Omnivore eingestellt wird und am 15. November endgültig dichtmacht. Die Daten wandern zu Elevenlabs; der App, die weiter unten ebenfalls erwähnt wird.

Eins muss man dieser App lassen: Sie hat einen besseren Namen als die gesamte Konkurrenz¹: Sie heisst Omnivore (iPhone und Android) und gehört wie Pocket und Instapaper in die Kategorie der Später-Lesen-Apps. Sie richtet sich nach eigenem Bekunden an «ernsthafte Leserinnen und Leser», und sie hat einen klaren Vorteil gegenüber dem restlichen Feld: Sie ist Open-Source.

Die Leseansicht am iPhone, vielseitig konfigurierbar.

Ich habe App im Hinblick auf die Vorlesen-Funktion getestet. Die Sprachsynthese, die es bei vielen Newssites inzwischen gibt, hat mich auf den Geschmack gebracht. Doch ich möchte mir die Texte nicht auf der jeweiligen Site anhören, sondern in einer App, die für alle vorzulesenden Inhalte zuständig ist. Und da ist die Leselisten-App der ideale Kandidat.

Um es vorwegzunehmen: Als persönlicher Nachrichtensprecher ist Omnivore nicht die erste Wahl. Die Sprachsynthese ist zwar akzeptabel, doch im direkten Vergleich zu Elevenlabs Reader fällt sie weit zurück. Diese App hat die natürlicheren, sympathischeren Stimmen und eine angenehmere Präsentation.

Doch Omnivore hat andere Stärken, was uns dazu bringen könnte, uns dennoch mit der Sprachsynthese anzufreunden. Dazu ein wichtiger Tipp: Wenn wir das mit den Standardeinstellungen tun, werden deutschsprachige Inhalte als Englisch vorgelesen – und das ist grauenvoll. Um das zu verhindern, öffnen wir die Rubrik Profile, klicken hier auf Text to speech und wählen bei Default Language den Eintrag German aus. Im Abschnitt Voices bei German finden wir sechs Stimmen zur Auswahl.

Lustig: Leni liest Texte sogar auf Schweizerdeutsch. Und zwar, indem sie Hochdeutsch auf etwas übersetzt, das fast nach Zürichdeutsch klingt. Das ist amüsant, aber weit entfernt von überzeugendem Dialekt. Darum empfehle ich Katja – die finde ich am angenehmsten. Auch okay ist Christoph.

RSS und Newsletters

Zu den Stärken von Omnivore zählt die Möglichkeit, Quellen automatisch per RSS einzubinden. Theoretisch praktisch, doch bei meinem Test hat der Import des Feeds von meinem Blog leider nicht funktioniert. Auch die Newsletter lassen sich an Omnivore schicken und dort lesen und organisieren. Dazu erhalten wir eine Mailadresse, an die wir die Newsletter hinschicken oder weiterleiten können. Jedenfalls ein heisser Tipp für alle jungen Menschen, die eben erst gelernt haben, dass es E-Mail-Newsletter gibt: Verwendet dafür eine separate Mailadresse, Firefox Relay oder die Funktion «E-Mail-Adresse verbergen» von Apple.

Omnivore im Browser, mit der schnellen Suche.

Die Mailadresse von Omnivore, die z.B. [email protected] lauten kann, nimmt auch PDFs entgegen, die ebenfalls ins gesammelte Lesematerial eingespeist werden. Eine solche Mailadresse lässt sich in den Einstellungen bei Emails einrichten.

Die Übersicht der gespeicherten Inhalte am iPhone.

Dieses Material lässt sich in der App oder auch via Web nach allen Regeln der Kunst organisieren:

Unter Inbox erscheinen die manuell gesammelten Informationen. Diese lassen sich via Plus-Symbol per URL hinzufügen. Inhalte können auch über den Teilen-Befehl des iPhones (via Sharesheet) eingespeist werden.
Die Inbox hat fast ein Dutzend Ansichten (Continue Reading, Non-Feed-Items, Highlights, Unlabeled, Oldest First, Files, Archived, Unread, Downloaded und Deleted) und diverse Sortiermöglichkeiten (Newest, Oldest, Shortest, Longest, Recently Read und Recently Published).
Einem Eintrag lassen sich Labels und Notizen hinzufügen. Es gibt auch die Highlights, das sind quasi Leuchtstift-Markierungen interessanter Stellen.
Unter Following erscheinen die Feeds und Newsletter. Sie lassen sich nach den gleichen Kriterien wie die Elemente der Inbox sortieren, filtern (Ungelesen, Feeds, Newsletters) oder nach Label auswählen.

Wir sehen: Die Grenzen zwischen Lese-App und Wissensbasis sind fliessend. Es gibt auch eine Synchronisation mit Werkzeugen für die Wissensverwaltung, namentlich zu Obsidian, Notion und Logseq.

In der Leseansicht starten wir die besagte Vorlesefunktion. Wir können ferner wiederum Labels zuweisen, Notizen und Highlights erfassen. Auch Notizen lassen sich speziell an bestimmte Stellen im Text hängen. In der Leseansicht wählen wir Font, Schriftgrösse, Zeichen- und Zeilenabstand, und es gibt vier Farbschemen (Themes) zur Auswahl. Über das Menü gibt es zusätzlich einige interessante Funktionen, zum Beispiel, einen Artikel über Archive.today zu öffnen, falls er dort abgelegt ist. Wir können auch den Link kopieren und die Leseposition zurücksetzen. Via Reccommend ist es möglich, den Artikel in einem Club zu empfehlen. Das sind virtuelle Räume für Teammitglieder und Gleichgesinnte, in denen sie Lesestoff austauschen.

So weit, so schlüssig. Da ich mit Pocket nicht mehr so richtig zufrieden bin, überlege ich mir derzeit ernsthaft einen Umstieg. Das Tolle an der Sache ist, dass es eine Möglichkeit gibt, die Pocket angehäuften Artikel zu importieren – und zwar vollständig, falls es nicht mehr als 20’000 Artikel sind. Ich habe das ausprobiert, und es klappte gut, auch wenn es lange dauerte, bis der Bestand der letzten fünf Jahre herübergewandert war. Den Import müssen wir am Desktop-Computer anstossen, und zwar über die Seite Integration in den Einstellungen. Dort autorisieren wir den Zugriff auf Pocket, woraufhin der Vorgang startet.

Fazit: Ein definitives Urteil erlaube ich mir noch nicht. Aber Omnivore gefällt mir gut. Einige der Dinge, die ich bereits schätze:

Die Möglichkeit, durch eine Wischgeste von rechts nach links einen Eintrag zu archivieren oder optional zu löschen.
Wenn wir von links nach rechts wischen, pinnen wir den Eintrag an. Er erscheint dann zuoberst in der Liste.
Nerd-Features wie die Rules.

Die sind im Moment noch im Betastadium und daher nur über die Website und nicht in der App verfügbar. Über eine Regel lassen sich anhand bestimmter Kriterien automatisch Labels hinzufügen, Benachrichtigungen senden oder Beiträge archivieren.

Fussnoten

1) Dicht gefolgt von Hoarder – wobei es sich bei der App um eine selbst gehostete, freie Software zur Bookmark-Verwaltung denn um eine Leselisten-App handelt. ↩

Beitragsbild: In der Badewanne lässt es sich gut essen. Und lesen, natürlich (Artem Labunsky, Unsplash-Lizenz).

#FreieSoftwareFOSS #RSS