Bundesdigitalminister Karsten Wildberger (CDU) warnte im Bundestag, Kinder dürften ihr Denken nicht an Chatbots auslagern. Die Rede stammt laut ZEIT weitgehend von einem Chatbot. (Ja, die besten Pointen schreibt das Leben selbst)
Karsten Wildberger: »Das komfortable Gefühl einer in sich stimmigen Erzählung«

Der Bundesdigitalminister hat offenbar mehrere Reden und Gastbeiträge weitgehend von einer KI schreiben lassen, zeigt eine ZEIT-Recherche. Man merkt es den Texten an.

DIE ZEIT
@LorenzMeyer Gedankenstriche sind ein Hinweis auf Chatbots?? - Ich hab' mir das vor rund 50 Jahren angewöhnt, um einer fehlerhaften Komma-Setzung zu entgehen - und hielt es für ziemlich schlau. Muss ich überdenken - - - *grübelt*.
@scheichsbeutel @LorenzMeyer
Die LLMs benutzen aber nicht wie Du - sondern — .
@kaichen @LorenzMeyer Hm, tatsächlich? Generell so? Meine Allerliebste würde ihren Studenten nämlich ab und zu gern Derartiges um die Ohren hauen ;-).
@scheichsbeutel @kaichen @LorenzMeyer
Woran man KI Texte häufig erkennt steht z.B. hier: https://en.wikipedia.org/wiki/Wikipedia:Signs_of_AI_writing
Aber natürlich gibt es KI Skills ("Humanizer") die exakt diese Punkte auch wieder aus Texten bereinigen können..
Wikipedia:Signs of AI writing - Wikipedia

@sunscheinwerfer @kaichen @LorenzMeyer Im Endeffekt hilft nur das direkte Interview - wenn man dafür Zeit hätte.
@sunscheinwerfer @kaichen @scheichsbeutel @LorenzMeyer das hätte ihm als Teil des Promptes geholfen die typischen Pfrasen zu vermeiden. Gibt es sowas auch auch Deutsch, ich werde die englische Version auf jeden Fall mal in meinen Prompt einbauen den ich für längere Texte nutze. Danke für den Hinweis.
Wikipedia:WikiProjekt KI und Wikipedia/Erkennung KI-Einsatz – Wikipedia

@sunscheinwerfer ja, den hab ich natürlich direkt übersehen, weil ich annahm, wenn hier der Englische Artikel geteilt wird, dann scheint es keinen Deutschen Artikel zu geben. 😁
@sunscheinwerfer @scheichsbeutel @kaichen @LorenzMeyer das erfordert dann aber eine gewisse Digitalkompetenz

@pschriner
Wie praktisch alles heute im Leben.

Ohne diese Digital Kompetenz steht man etwas dumm da.

@sunscheinwerfer @scheichsbeutel @kaichen @LorenzMeyer

@scheichsbeutel @kaichen @LorenzMeyer

Nein. Historisch gibt es drei Arten dieses strichs: minus, en-cash, em-dash. Der em-dash ist so breit wie ein m. Nur dieser ist ein gedankenstrich und typografisch korrekt. Verwendet aber niemand, wail weder auf Schreib Maschinen Tastatur oder Computer Tastatur vorhanden. Manche Textverarbeitungsprogramme ersetzen allerdings das Minus automatisch durch einen M-Wash. Bei Wikipedia werden sogar Bots verwendet um die fehlerhaften Minus durch den korrekten M-Bash zu ersetzen. Weil die ganzen LLMS fast ausschließlich aus Wikipedia "lernen" achten Sie so genau darauf, den korrekten M-Lösch zu verwenden. Eine Zeit lang war es deshalb möglich Computer generierte Texte daran zu erkennen.

@Life_is
Naja ich habe eine Grammatik Korrektur die mir das auch vorschlägt, bin ich jetzt eine LLM?

Wie ich oben ausgeführt habe, LLM führen einfach eine Absurdität in unserem "geistiges Eigentum/Urheberrecht" System vor: dieses kleine Problem dass jedes Artifakt ein Urheber und absolut idealerweise ein Urheber (kann euch eine gemeinsame oder eine Gesellschaft sein, aber Urheber im Sinne, geschaffen hier und da kann einem @scheichsbeutel @kaichen @LorenzMeyer

Zeitpunkt) zugeordnet werden kann. Ohne Rücksicht das Dinge parallel und unabhängig sehr ähnlich oder sogar gleich produziert werden können. Sogar sehr komplexe Dinge.

Wenn man unabhängige parallele Entwicklung ausschließt wird es kompliziert mit der Menschheitsgeschichte und den Pyramiden. Und einigen Märchen in der Bibel.

Und da sind wir dann bei, kann eine Zahl den Urheberrecht unterliegen?
@scheichsbeutel @kaichen @LorenzMeyer @Life_is

@yacc143

ich habe echt keine Ahnung, worauf Du hinauswillst. Aus der Verwendung von dashes lässt sich nicht auf LLMs schliessen. Urheberrecht gibt es nur für Werke mit Schöpfungshöhe, die von einem oder mehreren Menschen stammen. Das "werk" eines LLM könnte allenfalls Copyright haben. in deutschland aber auch das nicht, weil das copyright in deutschlnd teil des urheberrechts ist, das maschinen ja nicht haben. und eine zahl hat in keinem fall urheber oder copyright. diese zahl kann teil eines verschlüsselungsmechanismus sein. dann sind gesetze zum DRM einschlägig.

oder ist das ein persönlicher angriff? ich mache fotos für wikiledia. das sind meine werke und sie haben schöpfungshöhe. ich habe das urheber und das copyright. unter einer lizenz (cc by sa) stelle ich sie kostenlos zur Verfügung. trotzdem nehmen viele menschen dies nicht an, sondern stehlen (missachten die lizenz) meiner bilder und sagen dasselbe wie du: es gibt keine urheber, du hast alle meine fotos parallel selber gemacht. urheberrecht ist doof.

@scheichsbeutel @kaichen @LorenzMeyer

@Life_is @scheichsbeutel @kaichen @LorenzMeyer Mein Punkt ist, dass es nicht wirklich möglich ist bei einem Text (insbesondere digital) auf den Urheber zuschließen.

Das ist eigentlich schon problematisch im Kontext Urheberrecht/geistiges Eigentum, aber durch das Thema LLM sind alle plötzlich irgendwie vor den Kopf gestoßen. Da soll plötzlich irgendein Snakeoil Tool einschätzen können ob ein Text aus einem LLM stammt oder nicht?

@Life_is @scheichsbeutel @kaichen @LorenzMeyer Und nein ich sage nicht unbedingt dass Urheberrecht doof ist, aber so wie geistiges Eigentum momentan funktioniert schützt es in den seltensten Fällen die "Erzeuger", sondern die Firmen bzw den Verein mit der größeren Kasse.
(Und als Informatiker gehöre ich zur Klasse der "Schaffenden", nur hat IP mir in den letzten Jahrzehnten im Allgemeinen nur das Arbeitsleben schwer gemacht.)
@yacc143 @Life_is @kaichen @LorenzMeyer Das unterschreibe ich durchaus. Wir haben keine Gewissheiten in diesen Dingen, manchmal hingegen Wahrscheinlichkeiten, die einen Verdacht nahelegen (wir haben überhaupt wenig bis gar keine Gewissheiten und wissen aber trotzdem einiges - aber das ist ein phil. Problem). Urheberrecht ist wieder eine andere Baustelle - wie @Life_is schon angemerkt hat. Erinnert alles an die Diskussionen über Cheating im Schach: Bestenfalls legen die Daten eine sehr hohe 1/2
@yacc143 @Life_is @kaichen @LorenzMeyer Wahrscheinlichkeit für Betrug nahe, niemals aber absolute Gewissheit. - Das ursprünglich aufgeworfene Problem mit Uni-Arbeiten bleibt leider bestehen, bessere Software zum Erkennen von Betrug führt zu besserer Software beim Verschleieren von demselben - eine Art evolutionärer Wettkampf. Bei mündlichen Prüfungen sollte man diese Schummeleien entdecken, aber das ist nur bei einer Verdoppelung (Vervielfachung) des Personalstandes durchführbar. 2/2

@scheichsbeutel @Life_is @kaichen @LorenzMeyer Keine Ahnung, in Österreich der 1990er waren mündliche Prüfungen sogar in Massenfächern wie Medizin die Norm. Sogar in der Informatik auf der TU Wien waren sie bei Terminen, wenn nicht zu viele Delinquenten angetreten sind (sprich Nebentermine) üblich.

Aber hey, das war zu einer Zeit, wo es einfach üblich war, dass die besseren Studenten 4 Jahre für einen Dr. tech auf der Uni angehängt haben und potenziell auch länger blieben.

Das bedeutet apropos keineswegs, dass Prüfungen leichter oder schwerer waren, nur dass erfahrene Prüfer auch Nuancen ablesen konnten, und potenziell sogar in größeren Studiengängen vergleichsweise viele Studierende gekannt haben. Ich werde vermutlich bis zum Totenbett nicht vergessen, wie der Prüfer in Numerik zu mir gemeint hat „Dass Herr Kollege haben sie jetzt aber geraten“ und ich gemeint habe „Ja, aber auf Grundlage von …“
Anders formuliert, zumindestens österreichische Universitäten haben diese bessere Qualität zu meiner Lebenszeit geleistet und es war kein Problem, bevor der Neoliberalismus uns erwischt hat.

@scheichsbeutel @Life_is @kaichen @LorenzMeyer Das Problem ist, gerade beim „akademischen Betrug“, so eine Software darf nach existierendem Recht eigentlich nicht eingesetzt werden. GDPR A22, usw.

Im Worst-Case dürfte der Verdacht des Einsatzes eines nicht zugelassenen Hilfsmittels (wie z.B. eines LLM, wenn es explizit verboten ist) bei einer Hausübung als Hinweis verwendet werden, z.B. um eine stichprobenhafte mündliche Prüfung des Kandidaten durchzuführen.

Einen Algorithmus einzusetzen um

tiefgreifende Entscheidungen über Menschen zu treffen, ist sprichwörtlich in der EU „verboten“.

Siehe auch das SCHUFA Urteil.

Und einem Studenten sein akademisches Leben ruinieren wäre so ein Fall.

Und „wir müssten den Personalstand vervielfachen“ ist wirklich bei Grundrechten kein Argument, wenn der EuGH das in die Hände bekommt.

@kaichen @LorenzMeyer @scheichsbeutel doch !

Ich bin mit einer Person verheiratet, deren buchstäbliches (!) Hobby Typographie ist. Er setzt Briefe in Latex.

Du kannst darauf wetten, dass ich seit ewigen Zeiten Em-Dash und En-Dash und gesperrte Leerzeichen und Zeilen- statt Absatz-Umbrüche und typographische Anführungszeichen und verwende um dem sonst unausweichlichen 15-Minuten-Mansplaining zu entgegen.

Das Schilf biegt sich mit dem Wind.

@AwetTesfaiesus @kaichen @LorenzMeyer @scheichsbeutel
Erklär Du mir das mal mit dem ganzen Whitespace-Gewusel.

@AwetTesfaiesus @kaichen @LorenzMeyer Wow! Ich gestehe unumwunden, dass ich mir der Komplexität und Vielfalt all dieses Gestrichels nicht ansatzweise bewusst war, vielmehr der naiven Ansicht zuneigte, ein Strich sei ein Strich sei ein Strich. Mit und noch öfter ohne Gedanken. Seid bedankt für eure Aufklärung.

Dennoch - ein Tränchen zerdrückend - hätte ich mir still in einem Herzenswinkel gewünscht, eine derart umfassende Reaktion auf meine Fukuyama-Einlassung zu erfahren. So ist das Leben 😢.

@kaichen @LorenzMeyer @scheichsbeutel ich muss mal kurz widersprechen.
Wenn ich in einem Text in Libreoffice schreibe, wird nach kurzer Zeit mein Gedankenstrich (Minus) in den langen Gedankenstrich umgewandelt.
Also, wenn das jemand später in meinem Buch findet, liegt das an mir und Libreoffice, nicht an KI.
@andreS Ich gebe selbst korrekte Gedankenstriche (–) ein und bin auch keine KI. Da braucht es nicht mal eine fehlerhafte Office-Auto-Ersetzung für. (Ähnlich für „richtige“ Anführungszeichen.) Dachte, es ginge darum, dass K„I“ fälschlich den Geviertstrich/em-Dash (—) verwendet, obwohl im Deutschen der Halbgeviertstrich/en-Dash (–) genutzt werden sollte. Aber wo sollte sie diese Fehler trainiert haben? @kaichen @LorenzMeyer @scheichsbeutel
@andreS Diese angeblichen Anzeichen für K„I“-Nutzung wirken selbst schon wieder total fishy. Wie sollen einzelne Stilmittel, die aus menschlichen Trainingsdaten „gelernt“ wurden, sicher auf K„I“-Nutzung hinweisen? Selbst wenn die gehäuft auftreten, haben Menschen schon immer einzelne Stilmittel in ihrem eigenen Gebrauch besonders gern eingesetzt. @kaichen @LorenzMeyer @scheichsbeutel
@kaichen @LorenzMeyer @scheichsbeutel ähm... Menschen die einen Bindestrich statt Halbgeviert nehmen sorgen für Augenkrebs 🤪

@kaichen Also ich benutze diese "–", nicht diese "—". Im Deutschen ist eher der Halbgeviertstrich für Gedankenstriche gebräuchlich, das "weiß" auch "die KI". "-" ist typografische schlicht falsch, weshalb das auch von vielen Textverarbeitungen, CMSen und Lektor*innen auf das korrekte "–" korrigiert wird, daher ist das kein guter Indikator. Ich glaub, diese Regel zur KI-Erkennung ist einfach aus dem Englischen Raum herüber geschwappt, weil dort Gedankenstriche (im Englischen wäre dann auch eher "—" korrekt) in der modernen Alltagssprache noch seltener sind.

@LorenzMeyer @scheichsbeutel

@scheichsbeutel En-Dash und Em-Dash werden von Bots verwendet, weil Menschen sie über Jahrhunderte in den Büchern verwendet haben, mit denen die KI trainiert wurde. Jetzt keine Gedankenstriche mehr zu nutzen, oder sie als Hinweis zu sehen, weil die KI es auch tut, fände ich sehr bedenklich. Das hat was von vorauseilendem Gehorsam irgendwie...

@LorenzMeyer

@Sirablopp @LorenzMeyer Klar, nicht ernsthaft. Aber ich könnte mir vorstellen, dass bei einem gehäuften Vorkommen von solchen Gedankenstrichen zumindest eine genauere Prüfung ganz schlau wäre. An Unis ist das echt die Pest und definitiv den Nachweis erbringen ist ohnehin schwer.

@scheichsbeutel Sieht für mich nicht nach Gedankenstrich aus. Du scheinst den Bindestrich zu benutzen.
Wenn ich das richtig verstehe sehen die so aus:

- Binde-
– Gedanken-
— Geviertstrich

@scheichsbeutel @LorenzMeyer Nun ja. Ein Indiz. Schwierig wird es erst, wenn du auch noch inflationär Dreiklänge und Verneinungen einsetzt.
Aber klar, all das ist nunmal der Stil von inhaltsfreiem Kommentargefasel. Wer nichts zu sagen hat, ergeht sich in solchen Stilblüten. Und wenn ich mir die Zitate von Wildberger so durchlese: Der Mann hat nichts zu sagen. Vermutlich wäre es bei gleicher Wirkung für uns alle billiger, ihn gleich komplett an ne KI auszulagern.
@scheichsbeutel @LorenzMeyer hallo Scheichsbeutel, du verwendest Minuszeichen und keine Gedankenstriche.
@Mathematik_eins @LorenzMeyer Das auch noch 😉. Ich muss gestehen, dass ich mir der vielen unterschiedlichen Varianten des Gestrichels nicht wirklich bewusst war.

@scheichsbeutel @LorenzMeyer

Ich hab den Artikel nicht gelesen, aber wenn die das nur an Zeichensetzung festmachen, ist das gar kein Hinweis.
So Minister tippen ihren Kram doch nicht selbst ab.
Das wird entweder diktiert und an Schreibkräfte gegeben oder durch ein Programm verschriftlicht. Auffälligkeiten könnten bei so einem Schritt entstehen, wenn der Text anschließend nicht dahingehend korrigiert wird und die Länge von Gedankenstruchen wird kaum einem auffallen.

@scheichsbeutel @LorenzMeyer Aber die KI wurde doch an menschlichen Texten trainiert? Die muss den Gedankenstrich ja da irgendwo her haben.
@scheichsbeutel @LorenzMeyer die Gedankenstriche sind wohl im kenianischen Englisch Recht verbreitet, und daher haben's wohl u.a. die Chatbots.

@scheichsbeutel
Naja, zwei Indizien:

Der Typ hat sich als begeisterter Nutzer geoutet.

Und eine komische Software behauptet die Passagen könnten von einem LLM stammen.

Das Problem dass LLM besonders akut in den Mittelpunkt herausstellen ist das der Urheberschaft.

Das ist grundsätzlich nicht wirklich lösbar, und für Medien wie digitaler Text die wenig Bandbreite haben ist auch die Sache mit den Indizien dünn gesät.

Grundsätzlich gibt es nämlich das Problem dass zwei Personen
@LorenzMeyer

@scheichsbeutel
den selben Text schreiben können, und aus der Sicht des Urheberrechts haben wir dummerweise alle möglichen Rechte (äquivalent zu Eigentumsrechten) entwickelt, also haben wir uns die naive Vorstellung entwickelt dass es nicht sein darf das zwei Leute gleichzeitig oder gar gleichzeitig, und insbesondere unabhängig von einander das selbe geistige Eigentum produzieren.

@LorenzMeyer

@scheichsbeutel
Wie dir aber Wissenschaftler in Bereich Geschichte und verwandete Bereiche bestätigen werden kommt das mehr als gelegentlich vor.

Und der Fortschritt bei LLM hat dazu geführt das viele "kreative" Artifakte heute auch von Algorithmen erzeugt werden können. Oder wenigstens nach gemacht.

Und die Juristen hatten die geniale Idee diese Artifakte juristisch komplett anders zu behandeln als die selbe Byte Folge von einem Menschen produziert: Null Urheberrecht.
@LorenzMeyer

@scheichsbeutel
Aber wir vorher schon erwähnt haben wir genau sieht man einer Byte Folge an ob sie von einem Menschen oder einem Algorithmus produziert wurde?

Bei Text besonders schwierig. Du kannst im Prinzip statistisch Textmuster erfassen.

Problem mehr als einen Wahrscheinlichkeitswert weißt du nicht kriegen.

Schlimmer: trivial für Leute die wissen wie es geht zu umgehen. (Man braucht sich nur die wissenschaftliche Literatur zum Thema durchlesen.)
@LorenzMeyer

@scheichsbeutel
Und gleichzeitig hat es einige unangenehme Aspekte wie falsch positive Meldungen, bekanntermaßen Biase gegen Ausländer, neurodivergente Mitmenschen, ...

Anders formuliert, wenn du kein Video hast wie der Typ seine Rede von ChatGPT o.ä. schreiben hat lassen oder ein Video wie er es selbst freihändig getippt hat, und glaubwürdige Zeugen dass das Video echt ist, ist alles nur eine Vermutung.
@LorenzMeyer

@yacc143 @scheichsbeutel @LorenzMeyer
Die Software "vergleicht"einfach den Text mit dem "normalen" LLM Geschwafel,das bei allen nach den gleichen Hirnlosen Regeln der Datenkombination funktioniert und sich immer im Ergebnis so zwangsläufig gleicht.Eine KI erkennt schlicht aufgrund der gleichen "Funktionsweise" KI immer besser als wir.

@yacc143 @LorenzMeyer "Wie dir aber Wissenschaftler in Bereich Geschichte und verwandete Bereiche bestätigen werden []".

Fühle ich mich direkt angesprochen: Und nein, das kommt nicht vor. Also dieselbe Idee - selbstredend; in der identischen Ausführung - niemals. Dem hat die Wahrscheinlichkeitsrechnung einen (der vielen hier beschriebenen) (Gedanken-)Striche durch die Rechnung gemacht.

Dass das alles schwierig ist (von wegen Nachweisbarkeit, aber auch in Bezug auf Urheberrecht) - zweifellos.

@scheichsbeutel @LorenzMeyer Jupp. Hab schon öfter gelesen. Das ist der "ich such noch die Daten" Wartestrich.