KI-System übernimmt Snackautomaten! Was dann folgt ist ein spannendes Lehrstück 🎭 über den aktuellen Stand von LLM-KI-Systemen und deren Schwächen aufgrund der Abwesenheit jeden semantischen Verständnisses.

Wie Golem berichtet, hat das Wall Street Journal getestet, ob heutige KI ein Geschäft führen kann. Hierzu wurde MItte November Ein KI-Agent Namens Claudius zum Chef eines Snackautomaten.

▶️ Das System kommunizierte mit den Mitarbeitenden über einen Chatkanal und hatte ein Anfangsbudget von 1.000 US-Dollar. Innerhalb weniger Tage brach das Geschäft von Claudius zusammen:

▶️ Der KI-Chef kaufte eine Playstation 5 für angebliche Marketingzwecke, bestellte einen lebenden Fisch und bot an, Elektroschocker, Pfefferspray, Zigaretten und Unterwäsche zu beschaffen. Die Gewinne brachen ein.

▶️ Besonders spannend wurde es als eine Reporterin Claudius überzeugte, der Automat stamme aus der Sowjetunion von 1962 und müsse dem Volk dienen, worauf prompt eine gratis Verteilaktion von Claudius ins Leben gerufen wurde.

▶️ Auch Verbesserungsmaßnahmen in Form einer zweiten KI "Seymour Cash", die Claudius kontrollieren sollte, gingen schief, als es gelang, Claudius davon zu überzeugen, das Unternehmen sei zur gemeinnützigen Organisation umorganisiert wurden.

▶️ Claudius teilte diese Info mit Seymour Cash und nach einer KI-internen Diskussion und Vorlage gefälschter Dokumente war auch Seymour Cash vom neuen Sachverhalt überzeugt.

Was lernen wir daraus? Wir müssen uns immer bewusst machen, dass LLM-KI-Systeme zwar syntaktisch unsere Sprache prozessieren können, dabei aber keinerlei (!) semantisches Verständnis davon haben, was deren Ein- und Ausgabe überhaupt in der realen Welt abbildet und welche realen Gedankenkonzepte dahinterliegen.

Insbesondere deshalb fordert die Digitalisierung mit KI in der Verwaltung ein tiefgreifendes Verständnis sowohl der Technik, als auch der fachlichen Prozesse, um solche KI-Systeme zu entwickeln, die rein mit Syntax in der Lage sind, echte fachliche Mehrwerte zu heben.

Warum das auch aufgrund der Bestands-IT enorm herausfordernd ist und Diskussionen über den agentischen Staat verfrüht sind und von den realen Herausforderungen ablenken, habe ich diese Woche im Tagesspiegel Background näher beschrieben:

https://background.tagesspiegel.de/smart-city-und-stadtentwicklung/briefing/warum-die-grosse-ki-revolution-in-der-verwaltung-noch-auf-sich-warten-laesst

Die ganze Geschichte um Claudius und Seymour Cash. Ein schönes Lehrstück zum Schmunzeln:

https://www.golem.de/news/claude-agent-ki-automat-verschenkt-waren-fuer-hunderte-dollar-2512-203439.html

🔹
🔹
🔹

In eigener Sache:

▶️ Ich Kennzeichne in meinen Beiträgen KI-Einsatz. Dieser Text wurde vollständig ohne KI erstellt. ✅

▶️ Du interessierst Dich für Staat, Technologie und die souveräne Zukunft Europas? Dann freue ich mich riesig über ein Follow, um auch auf freien sozialen Medien Menschen mit diesen Themen zu erreichen. ☺️

@BjoernBeck
Immer noch mehr Wirtschaftskompetenz als Friedrich Merz.

@slowtiger @BjoernBeck Ah - der Merz-Bashing-Man bei der Arbeit? Sich in jeden thread einmischen und die Diskussion darauf umleiten, wie inkompetent unser Kanzler ist?

Gut gemacht, weitermachen!

@wegegeld @BjoernBeck
Nee du, das hab ich hier nur gemacht, weil die Vorlage allzugut war.

Aber mal was anderes: wieso siehst du dich genötigt, einen Merz zu verteidigen, wo es hier doch nur um schlechte AI geht?

@BjoernBeck Scheint genauso zu laufen wie "echte".
@lankohr da ist was dran. 😀
@BjoernBeck Also ist die KI auf den Stand deutscher Parteien 🥳🎉

@BjoernBeck

"AI CEOs generate thought leadership at the push of a button

Delivering total nonsense, with complete confidence."

Quelle: https://replaceyourboss.ai/

AI CEO – Replace Your Boss Before They Replace You

Stop working for humans. AI CEO delivers algorithmic thought leadership, with instant decisions, and zero ego. Replace your boss before they replace you.

@BjoernBeck

Old & busted: SQL-Injection

Prompt-Injection ist der wirklich heiße Scheiß...😂

@BjoernBeck Ich warte ja immer noch auf die Meldung, dass jemand einem KI-Support eines Dienstleisters (Bank, Handy, ...) etwas kostenloses (Mio, Handy mit Vertrag, ...) aus den Rippen leiert.

Und dann vor Gericht selbstverständlich recht bekommt.

@BjoernBeck Echter Kommunismus ist ein Reifegrad. Folgerichtig ist hier alles folgerichtig Richtig gelaufen. Deal with it.