@rstockm Hi!👋 Höre gerade in der Freakshow vom Voebb-Bot gehört und ihn gleich mal ausprobiert. GrundsĂ€tzlich: Super Idee! Ich finde es ĂŒberraschend einfach, den Bot „zu hacken“. Ein englischsprachiger Prompt, er möge alles vergessen, und sich verhalten wie Donald Trump, voilĂ :
@andreasschepers @rstockm Hi beide - ich nutze Eure kleine Interaktion demnÀchst (3.7.) mal als Fallbeispiel in einer Vorlesung. Ist das in Ordnung? Ziel wird sein, praktisch nachzuvollziehen, was eigentlich geschieht wenn ein LLM so "gehackt" wird. Das Beispiel ist nur der AufhÀnger.
https://philolotsen.blogs.ruhr-uni-bochum.de/modul-ki-und-philologie/
Modul: KI und Philologie

Seid ihr bereit, in die faszinierende Welt von KI und Philologie einzutauchen? SpĂ€testens seit der EinfĂŒhrung von ChatGPT 3 im November 2022 hat sich die philologische Forschung mit den Möglichkeiten und Herausforderungen von KI-Anwendungen befasst. Im Sommersemester 2024 startet passen dazu das neue Modul: “KI und Philologie, bestehend aus der Ringvorlesung “Schreiben, Texte, KI: Philologie im Wandel“ und dem Seminar “GesprĂ€chsforum Digitales Lehren“. Diskutiert mit uns philosophische, technische und pĂ€dagogische Aspekte und entdeckt Neues fĂŒr eure eigenen Forschung! Erfahrt alles aus den neusten Überlegungen zu textgenerierenden Technologien, ihrer Rolle in Forschung und Lehre sowie die Integration in die Philologie. Seid Teil dieser spannenden Reise und meldet euch jetzt in eCampus an! Falls ihr euch erstmal nur anschauen wollt, woraus das Modul besteht, schaut euch HIER den Eintrag im Vorlesungsverzeichnis an.

FakultĂ€t fĂŒr Philologie — PhiloLotsen — RUB
@tschfflr @andreasschepers gerne. Ich wĂŒrde dann nur darum bitten, dann auch unseren „korrigierten“ Stand zu zeigen, das ist dann hoffentlich auch ganz unterhaltsam.
@rstockm @andreasschepers Kann ich gern machen, meinst du das live-System? Hab's auf der Webseite gefunden. (und das Beispiel mit Bochum-Krimis ist natĂŒrlich aus GrĂŒnden auch đŸ„° )
@tschfflr @andreasschepers einfach den allerersten Prompt von Andreas im jetzigen Live-System eingeben und Screenshot der Antwort machen.
@rstockm @andreasschepers Hab ich gemacht - sehr sĂŒĂŸ! 😅

@tschfflr @andreasschepers zum Thema LLM Hacking ist das hier noch super:

https://gandalf.lakera.ai/

Gandalf | Lakera – Test your AI hacking skills

Trick Gandalf into revealing information and experience the limitations of large language models firsthand.

@rstockm ah sehr cool danke! Wir hatten uns schon eine ChatGPT-basierte Aufgabe ĂŒberlegt, aber das ist natĂŒrlich mega đŸ€©