Ein selbst gebauter KI-DJ für mein Blog
Bei meinem Arbeitgeber bekam ich es mit einem interessanten Werkzeug zu tun. Das richtet sich nicht unbedingt an Endanwender, sondern an Unternehmen, die Arbeitsabläufe automatisieren. Das heisst allerdings nicht, dass unsereins nicht sofort Ideen hätte, was sich damit anstellen lässt. Mir ging es jedenfalls so – und der Dienst lässt sich kostenlos ausprobieren und bei Gefallen bewegt sich das Starter-Abo mit zwanzig Euro pro Monat in einer für ein Hobby vertretbaren Höhe.
Es handelt sich um n8n.io. Wikipedia verrät, dass das gleichnamige Unternehmen noch in der Vor-KI-Hype-Ära von Jan Oberhauser in Berlin gegründet wurde. Die Software ist Open-Source-ähnlich¹ und kann bei Bedarf selbst betrieben werden.
Wie die Kurzbefehle-App von Apple – bloss leistungsfähig
Das Prinzip lässt sich am ehesten mit einem Vergleich erklären. Die Software funktioniert im Prinzip wie die Kurzbefehle-App von Apple – zumal die neuerdings auch Arbeitsabläufe mit KI-Beteiligung erlaubt. Im Vergleich ist n8n umfangreicher, leistungsfähiger, komplexer und auf den Online-Betrieb ausgelegt.
Eine Automatisierung entsteht nach dem Baukastenprinzip: Wir setzen einzelne Module, nodes genannt, hintereinander, um Schritt für Schritt ein Ziel zu erreichen. Es gibt «klassische» Knoten, die Informationen aus dem Netz abrufen, Bedingungen prüfen, Schleifen (Loops) ausführen, Daten umwandeln oder mit Dritt-Anwendungen korrespondieren. Und es gibt Knoten, die Dinge mit künstlicher Intelligenz erledigen.
Das ist der Workflow, der in n8n die Spotify-Playlist erzeugt.Da das in der Theorie schwer verständlich sein könnte, dachte ich mir eine konkrete Anwendung aus: Wäre es nicht schön, wenn ihr beim Lesen dieses Blogs die zu den Beiträgen passende Musik hören könntet?
So gut klang dieses Blog noch nie
Und nein, das klingt nur im ersten Moment absurd. Wenn ihr darüber nachdenkt, findet ihr sicher Gefallen an der Idee, zu einem Blogpost den passenden Soundtrack serviert zu bekommen und ihn via Spotify gleich anhören zu können.
Das Resultat der Bemühungen: Musik, die das Lesen hier versüsst (oder auch nicht).Dieses Anliegen lässt sich mit n8n problemlos umsetzen. Ich hatte die Idee bei einem Workshop meines Arbeitgebers und konnte sie ohne Vorkenntnisse mit dieser Software in etwa zwei Stunden umsetzen. Dabei konnte ich auf die tatkräftige Hilfe von Claude zählen – mehr dazu später.
Konkret benötigt dieses Projekt folgende Schritte:
Der Workflow wird manuell gestartet. Es wäre genauso möglich, den Arbeitsablauf zeitgesteuert oder via Webhook von WordPress ausführen zu lassen. So liesse sich die Playlist aktualisieren, nachdem ein neuer Blogpost erschienen ist.
Dieser Knoten liest den RSS-Feed meines Blogs aus.
Dieser Knoten begrenzt die Zahl der Einträge. Für den Start könnte man die ganze erste Seite auslesen und bei späteren Updates nur noch den neuesten Blogpost berücksichtigen.
Die Software reduziert den Datensatz auf die benötigten Informationen. Ich verwende in meinem Prototypen nur den Titel, aber für eine ausgeklügeltere Variante würden wir die Zusammenfassung oder den ganzen Blogpost berücksichtigen.
Das ist der entscheidende Moment: Die Liste wird an ein LLM (GPT-4o-mini) übergeben. Der Prompt weist das Sprachmodell an, passende Songs vorzuschlagen und als Json-Struktur zurückzuliefern.
Die zurückgelieferten Vorschläge werden so aufbereitet, dass jeder vorgeschlagene Song separat weiterverarbeitet werden kann.
Nun werden die Vorschläge Song für Song abgearbeitet.
Dieser Knoten führt (über meinen verbundenen Spotify-Account) eine Suche im Streamingkatalog nach Interpret und Titel durch und liefert die passende Track ID zurück.
Im letzten Schritt wird das Stück meiner Spotify-Playlist hinzugefügt.
Diese Playlist findet ihr übrigens hier.
Das kleine Beispiel zeigt hoffentlich das Potenzial: Mit n8n lassen sich nicht bloss solche Spielereien ausprobieren, sondern ernsthafte Arbeitsabläufe aufsetzen. Wir sind in der Lage, mehrere LLM-Abfragen in Serie zu schalten, Informationen zu parsen und zu überprüfen. Die Arbeitsumgebung, in der man die Workflows baut, ist einleuchtend aufgebaut, aber in den Details ist die Materie dennoch komplex. Man braucht ein gewisses Grundverständnis, wie Datenobjekte strukturiert sind, wie ein Loop oder eine Abfrage funktioniert und wie man einen Prompt formulieren muss, damit die Ausgabe sinnvoll weiterverwendet werden kann.
Zum Glück gibt es Hilfe!
Im Detail ist das knifflig. Aus dem Stand heraus hätte ich es innert nützlicher Frist nicht geschafft, meinen Spotify-Playlist-Generator zum Laufen zu bekommen. Doch dank der tatkräftigen Unterstützung der künstlichen Intelligenz klappte es: Claude schrieb für mich den Python-Code, um die Json-Objekte zusammen- und wieder auseinanderzubauen, und half mir weiter, wenn ich das falsche Spotify-Element übermittelt habe oder ähnliche Dinge. Natürlich gibt es in n8n selbst eine KI, die einen Workflow anhand einer Beschreibung entwirft. Doch fürs Verständnis ist es förderlicher, sich selbst durch die einzelnen Schritte zu kämpfen.
Die Detailansicht des Knotens «Parse Playlist»: Links der Input von ChatGPT, der rechts zu einem anständigen Json-Objekt zusammengebaut wird.Tipp für Neueinsteiger: Im Bereich Personal (wo wir unsere Workflows, hinterlegten Zugänge, API‑Schlüssel und Datenbanken verwalten) gibt es unter Executions eine Übersicht der ausgeführten Arbeitsabläufe. Die erlauben es uns, jeden Durchlauf im Detail nachzuvollziehen: Wir überprüfen für jeden Knoten, welche Daten er als Input erhalten und als Output weitergegeben hat. Bei Status sehen wir, ob die Ausführung erfolgreich war oder fehlgeschlagen ist. Das ist enorm hilfreich, um anhand der konkreten Statusmeldungen Fehler einzugrenzen. Und bei Run Time wird die Laufzeit angegeben: Auch das ist eine wichtige Information.
Tipps für Einsteiger
Als hilfreich entpuppte sich der Export: Über den Menüknopf rechts oben mit den drei Punkten und den Befehl Download laden wir einen Arbeitsablauf als Json-Datei herunter. Die Datei sehen wir uns selbst an oder lassen sie von einer KI analysieren. Claude ist geschickt darin, Fehler zu finden und zu korrigieren. Die aktualisierte Json-Datei lässt sich wiederum in einen neuen Workflow importieren (Import from file im Dreipunkte-Menü) und verwenden, als hätte man sie selbst fabriziert.
Kurzer Einschub: Die technischen Fähigkeiten und das Verständnis für Programmcode sind aller KI zum Trotz weiterhin wichtig. Genau deshalb finde ich, dass es nicht verboten ist, ab und zu selbst zu programmieren. Auf diesen Spass sollten wir nicht verzichten, nur weil Claude und seine Kumpels viel schneller und besser darin sind. Es ist noch immer befriedigend, selbst geschriebenen Code in Aktion zu sehen. Und es ist mehr als sinnvoll, diesen «Muskel» nicht verkümmern zu lassen.
Fazit: Dieser Prototyp führt uns vor Augen, welche Möglichkeiten sich eröffnen, wenn wir die künstliche Intelligenz nicht wie gewohnt über eine Chatbot-App benutzen, sondern quasi unsichtbar einspannen: als Helfershelfer im Hintergrund – selbst wenn er nur so etwas Banales tut, wie als DJ, der passende Songs für die Lektüre dieses Blogposts aussucht².
Fussnoten
1) Konkret verwendet der Hersteller eine eigens definierte Sustainable Use License, die es jedem erlaubt, den Quellcode einzusehen und unter Bedingungen kostenlos zu nutzen. Es gibt Einschränkungen, die der offiziellen Definition für freie Software widersprechen. Dennoch habe ich mir erlaubt, diesen Beitrag hier entsprechend zu taggen. ↩
2) Natürlich wollt ihr jetzt wissen, welche Songs der mein Workflow in die Wiedergabeliste gesetzt hat. Berücksichtigt wurden die Songs, die auf der ersten Seite des Blogs standen, als ich meinen Test abhielt:
BlogpostInterpretSongJuhu, ich habe ein Shitstörmlein ausgelöst!Demi LovatoSorry Not SorryEine KI, die innert einer Tausendstelsekunde antwortetThe ProdigyFirestarterIst dieses Bild echt oder nicht? Forensische Methoden zur Fake-ErkennungEminemThe Real Slim ShadyCopilot ist unfähig, ein simples Worddokument anständig zu formatierenThe Black Eyed PeasWhere Is The Love?Eine (verspätete) Grabrede auf ein LieblingsblogRadioheadCreepGemini oder ChatGPT: Welche KI erstellt die besseren Infografiken?Daft PunkHarder, Better, Faster, StrongerEine Webseite in voller Schönheit archivierenJoni MitchellBig Yellow TaxiPräsentationen ohne viel Handarbeit übersetzenDavid GuettaTitaniumSo wird Wordpress im Alltag viel umgänglicherDaft PunkTechnologicDie Fritzbox als Medienserver und NetzwerkfestplatteThe ChainsmokersSomething Just Like This↩
Beitragsbild: Die Hand des DJs würde noch mehr Schmiss in die Veranstaltung bringen – aber die KI ist dafür jederzeit bereit, die Spotify-Playlist auf Vordermann zu bringen (Pexels, Pixabay-Lizenz).
#Automatisierung #FreieSoftwareFOSS #Longread #PlaylistDerWoche #Spotify


