Mastodawn

Ralf Stockmann Jun 3, 2024

Pünktlich zur #bibliocon24 starten wir im VÖBB einen neuen, experimentellen Dienst: den VÖBB-Chatbot. Als meines Wissens erste (?) deutsche Bibliothek kombinieren wir hier Sprachtalent und "Wissen" eines Large Language Models (#LLM) mit den vollständigen Metadaten unseres #VÖBB Kataloges (als sog. Embedding).

https://www.voebb.de

Ein thread: 🧵
1/6

Startseite - Verbund der Öffentlichen Bibliotheken Berlins

Online Katalog Verbund der Öffentlichen Bibliotheken Berlins

Show thread

Anatol Stefanowitsch Jun 3, 2024

@rstockm Warum nur.

Show thread

leidkultur Jun 3, 2024

@astefanowitsch @rstockm

Gerade als KI-Kritiker (zu denen ich mich auch zähle) sollte man so eine Anwendung feiern:

KI sollte Dinge die banal und nervig sind (Katalog nach Buch durchsuchen) vereinfachen bzw. übernehmen.

So wird im besten Fall die Zeit der Mitarbeiter:innen freigemacht für wichtige Dinge, die nur von Menschen sinnstiftend verrichtet werden können.

Show thread

Anatol Stefanowitsch Jun 3, 2024

@leidkultur

Show thread

leidkultur Jun 3, 2024

@astefanowitsch

Ja, funktioniert noch nicht. Es ist ja erstmal ein Experiment.

Show thread

Anatol Stefanowitsch

@leidkultur Funktioniert noch nicht, wird nie funktionieren, kann nicht funktionieren.

Show thread

leidkultur Jun 3, 2024

@astefanowitsch

Das kommt bei LLMs auf die Trainingsdaten an.

In unserer Firma nutzen wir ein LLM um das Unternehmens Wiki zu durchsuchen.

Das geht immerhin besser als die Original Suchfunktion der Wiki-Software.

Darüber hinaus gibt es ja auch andere Machine Learning Lösungen.

Show thread

Anatol Stefanowitsch Jun 3, 2024

@leidkultur Ein LLM ist ein Zufallstextgenerator, egal, mit welchen Trainingsdaten es gefüttert wird. Wer es als Suchmaschine einsetzt, hat ein ernsthaftes Problem. Aber das ist bekannt, das brauchen wir hier nicht zu diskutieren.

Show thread

leidkultur Jun 3, 2024

@astefanowitsch
Das ist als würdest du sagen ein Klimamodell sei ein „Zufallsgenerator“.

Ja, es arbeitet mit Wahrscheinlichkeiten (oder Gewichten), aber die sind eben kein „Zufall“, sondern das Ergebnis eines Trainingsprozesses.

Daher ist ein LLM immer nur so gut wie dieser Trainingsprozess und die genutzten Daten.

Wenn die gut gewählt sind und zum Anwendungsfall passen, erzielen sie gute Ergebnisse.

Die „generischen“ LLMs wie ChatGPT liefern deshalb auch nur generische Antworten.

Show thread

Esther Menhard Jun 5, 2024

@leidkultur @rstockm Mit welchen Daten wurde der VÖBB-Chatbot trainiert, woher stammen sie?

Show thread

Ralf Stockmann Jun 5, 2024

@esthermenhard @leidkultur das ist ein Komplett-Abzug unseres VÖBB Katalogs. Als embedding an die OpenAI API angeschlossen.