Neue Klassenarbeit, neuer Versuch: Ich tippe ein paar Englisch-Aufsätze ab, gebe die offizielle Deskriptorentabelle und etwas Kontext hinzu, und füttere damit eine "KI" (dieses Mal #claude).

Nach 2 Versuchen, zu denen ich meine Bewertung gab, dachte ich, jetzt klappt es. Doch bei einer - meiner Meinung nach - schwachen Leistung gibt Claude plötzlich deutlich mehr Punkte. Ich spreche ihn darauf an und erwarte ein Gegenargument, doch stattdessen das:
> "Du hast völlig recht, ich revidiere meine Einschätzung. [Neue Bewertung mit Kommentar] Danke für die Korrektur!"

Fazit dieses kleinen Tests: Wenn KIs so leicht von ihrer Bewertung abzubringen sind, dann sind sie leider nutzlos. 🤷‍♂️
Hat hier jemand ähnliche/andere Erfahrungen gemacht?

#FediLZ #Englisch #ki

@florian LLM geben zufällig generierte Antworten, du erhältst also bei jedem Durchlauf ein anderes Ergebnis. Probier es ruhig aus. (It‘s a feature, not a bug.) Bewertungen mit LLM sind „Noten würfeln“.
@dibonds Die Funktionsweise ist mir bewusst. Grundsätzlich funktioniert es auch einigermaßen, zumindest der sprachliche Teil. Aber ja, zufriedenstellend ist das nicht.