@pschriner
Wie praktisch alles heute im Leben.
Ohne diese Digital Kompetenz steht man etwas dumm da.
@scheichsbeutel @kaichen @LorenzMeyer
Nein. Historisch gibt es drei Arten dieses strichs: minus, en-cash, em-dash. Der em-dash ist so breit wie ein m. Nur dieser ist ein gedankenstrich und typografisch korrekt. Verwendet aber niemand, wail weder auf Schreib Maschinen Tastatur oder Computer Tastatur vorhanden. Manche Textverarbeitungsprogramme ersetzen allerdings das Minus automatisch durch einen M-Wash. Bei Wikipedia werden sogar Bots verwendet um die fehlerhaften Minus durch den korrekten M-Bash zu ersetzen. Weil die ganzen LLMS fast ausschließlich aus Wikipedia "lernen" achten Sie so genau darauf, den korrekten M-Lösch zu verwenden. Eine Zeit lang war es deshalb möglich Computer generierte Texte daran zu erkennen.
@Life_is
Naja ich habe eine Grammatik Korrektur die mir das auch vorschlägt, bin ich jetzt eine LLM?
Wie ich oben ausgeführt habe, LLM führen einfach eine Absurdität in unserem "geistiges Eigentum/Urheberrecht" System vor: dieses kleine Problem dass jedes Artifakt ein Urheber und absolut idealerweise ein Urheber (kann euch eine gemeinsame oder eine Gesellschaft sein, aber Urheber im Sinne, geschaffen hier und da kann einem @scheichsbeutel @kaichen @LorenzMeyer
Zeitpunkt) zugeordnet werden kann. Ohne Rücksicht das Dinge parallel und unabhängig sehr ähnlich oder sogar gleich produziert werden können. Sogar sehr komplexe Dinge.
Wenn man unabhängige parallele Entwicklung ausschließt wird es kompliziert mit der Menschheitsgeschichte und den Pyramiden. Und einigen Märchen in der Bibel.
Und da sind wir dann bei, kann eine Zahl den Urheberrecht unterliegen?
@scheichsbeutel @kaichen @LorenzMeyer @Life_is
ich habe echt keine Ahnung, worauf Du hinauswillst. Aus der Verwendung von dashes lässt sich nicht auf LLMs schliessen. Urheberrecht gibt es nur für Werke mit Schöpfungshöhe, die von einem oder mehreren Menschen stammen. Das "werk" eines LLM könnte allenfalls Copyright haben. in deutschland aber auch das nicht, weil das copyright in deutschlnd teil des urheberrechts ist, das maschinen ja nicht haben. und eine zahl hat in keinem fall urheber oder copyright. diese zahl kann teil eines verschlüsselungsmechanismus sein. dann sind gesetze zum DRM einschlägig.
oder ist das ein persönlicher angriff? ich mache fotos für wikiledia. das sind meine werke und sie haben schöpfungshöhe. ich habe das urheber und das copyright. unter einer lizenz (cc by sa) stelle ich sie kostenlos zur Verfügung. trotzdem nehmen viele menschen dies nicht an, sondern stehlen (missachten die lizenz) meiner bilder und sagen dasselbe wie du: es gibt keine urheber, du hast alle meine fotos parallel selber gemacht. urheberrecht ist doof.
@Life_is @scheichsbeutel @kaichen @LorenzMeyer Mein Punkt ist, dass es nicht wirklich möglich ist bei einem Text (insbesondere digital) auf den Urheber zuschließen.
Das ist eigentlich schon problematisch im Kontext Urheberrecht/geistiges Eigentum, aber durch das Thema LLM sind alle plötzlich irgendwie vor den Kopf gestoßen. Da soll plötzlich irgendein Snakeoil Tool einschätzen können ob ein Text aus einem LLM stammt oder nicht?
@scheichsbeutel @Life_is @kaichen @LorenzMeyer Keine Ahnung, in Österreich der 1990er waren mündliche Prüfungen sogar in Massenfächern wie Medizin die Norm. Sogar in der Informatik auf der TU Wien waren sie bei Terminen, wenn nicht zu viele Delinquenten angetreten sind (sprich Nebentermine) üblich.
Aber hey, das war zu einer Zeit, wo es einfach üblich war, dass die besseren Studenten 4 Jahre für einen Dr. tech auf der Uni angehängt haben und potenziell auch länger blieben.
@scheichsbeutel @Life_is @kaichen @LorenzMeyer Das Problem ist, gerade beim „akademischen Betrug“, so eine Software darf nach existierendem Recht eigentlich nicht eingesetzt werden. GDPR A22, usw.
Im Worst-Case dürfte der Verdacht des Einsatzes eines nicht zugelassenen Hilfsmittels (wie z.B. eines LLM, wenn es explizit verboten ist) bei einer Hausübung als Hinweis verwendet werden, z.B. um eine stichprobenhafte mündliche Prüfung des Kandidaten durchzuführen.
Einen Algorithmus einzusetzen um
tiefgreifende Entscheidungen über Menschen zu treffen, ist sprichwörtlich in der EU „verboten“.
Siehe auch das SCHUFA Urteil.
Und einem Studenten sein akademisches Leben ruinieren wäre so ein Fall.
Und „wir müssten den Personalstand vervielfachen“ ist wirklich bei Grundrechten kein Argument, wenn der EuGH das in die Hände bekommt.
@kaichen @LorenzMeyer @scheichsbeutel doch !
Ich bin mit einer Person verheiratet, deren buchstäbliches (!) Hobby Typographie ist. Er setzt Briefe in Latex.
Du kannst darauf wetten, dass ich seit ewigen Zeiten Em-Dash und En-Dash und gesperrte Leerzeichen und Zeilen- statt Absatz-Umbrüche und typographische Anführungszeichen und verwende um dem sonst unausweichlichen 15-Minuten-Mansplaining zu entgegen.
Das Schilf biegt sich mit dem Wind.
@AwetTesfaiesus @kaichen @LorenzMeyer Wow! Ich gestehe unumwunden, dass ich mir der Komplexität und Vielfalt all dieses Gestrichels nicht ansatzweise bewusst war, vielmehr der naiven Ansicht zuneigte, ein Strich sei ein Strich sei ein Strich. Mit und noch öfter ohne Gedanken. Seid bedankt für eure Aufklärung.
Dennoch - ein Tränchen zerdrückend - hätte ich mir still in einem Herzenswinkel gewünscht, eine derart umfassende Reaktion auf meine Fukuyama-Einlassung zu erfahren. So ist das Leben 😢.
@kaichen Also ich benutze diese "–", nicht diese "—". Im Deutschen ist eher der Halbgeviertstrich für Gedankenstriche gebräuchlich, das "weiß" auch "die KI". "-" ist typografische schlicht falsch, weshalb das auch von vielen Textverarbeitungen, CMSen und Lektor*innen auf das korrekte "–" korrigiert wird, daher ist das kein guter Indikator. Ich glaub, diese Regel zur KI-Erkennung ist einfach aus dem Englischen Raum herüber geschwappt, weil dort Gedankenstriche (im Englischen wäre dann auch eher "—" korrekt) in der modernen Alltagssprache noch seltener sind.
@scheichsbeutel En-Dash und Em-Dash werden von Bots verwendet, weil Menschen sie über Jahrhunderte in den Büchern verwendet haben, mit denen die KI trainiert wurde. Jetzt keine Gedankenstriche mehr zu nutzen, oder sie als Hinweis zu sehen, weil die KI es auch tut, fände ich sehr bedenklich. Das hat was von vorauseilendem Gehorsam irgendwie...
@scheichsbeutel Sieht für mich nicht nach Gedankenstrich aus. Du scheinst den Bindestrich zu benutzen.
Wenn ich das richtig verstehe sehen die so aus:
- Binde-
– Gedanken-
— Geviertstrich
Ich hab den Artikel nicht gelesen, aber wenn die das nur an Zeichensetzung festmachen, ist das gar kein Hinweis.
So Minister tippen ihren Kram doch nicht selbst ab.
Das wird entweder diktiert und an Schreibkräfte gegeben oder durch ein Programm verschriftlicht. Auffälligkeiten könnten bei so einem Schritt entstehen, wenn der Text anschließend nicht dahingehend korrigiert wird und die Länge von Gedankenstruchen wird kaum einem auffallen.
@scheichsbeutel
Naja, zwei Indizien:
Der Typ hat sich als begeisterter Nutzer geoutet.
Und eine komische Software behauptet die Passagen könnten von einem LLM stammen.
Das Problem dass LLM besonders akut in den Mittelpunkt herausstellen ist das der Urheberschaft.
Das ist grundsätzlich nicht wirklich lösbar, und für Medien wie digitaler Text die wenig Bandbreite haben ist auch die Sache mit den Indizien dünn gesät.
Grundsätzlich gibt es nämlich das Problem dass zwei Personen
@LorenzMeyer
@scheichsbeutel
den selben Text schreiben können, und aus der Sicht des Urheberrechts haben wir dummerweise alle möglichen Rechte (äquivalent zu Eigentumsrechten) entwickelt, also haben wir uns die naive Vorstellung entwickelt dass es nicht sein darf das zwei Leute gleichzeitig oder gar gleichzeitig, und insbesondere unabhängig von einander das selbe geistige Eigentum produzieren.
@scheichsbeutel
Wie dir aber Wissenschaftler in Bereich Geschichte und verwandete Bereiche bestätigen werden kommt das mehr als gelegentlich vor.
Und der Fortschritt bei LLM hat dazu geführt das viele "kreative" Artifakte heute auch von Algorithmen erzeugt werden können. Oder wenigstens nach gemacht.
Und die Juristen hatten die geniale Idee diese Artifakte juristisch komplett anders zu behandeln als die selbe Byte Folge von einem Menschen produziert: Null Urheberrecht.
@LorenzMeyer
@scheichsbeutel
Aber wir vorher schon erwähnt haben wir genau sieht man einer Byte Folge an ob sie von einem Menschen oder einem Algorithmus produziert wurde?
Bei Text besonders schwierig. Du kannst im Prinzip statistisch Textmuster erfassen.
Problem mehr als einen Wahrscheinlichkeitswert weißt du nicht kriegen.
Schlimmer: trivial für Leute die wissen wie es geht zu umgehen. (Man braucht sich nur die wissenschaftliche Literatur zum Thema durchlesen.)
@LorenzMeyer
@scheichsbeutel
Und gleichzeitig hat es einige unangenehme Aspekte wie falsch positive Meldungen, bekanntermaßen Biase gegen Ausländer, neurodivergente Mitmenschen, ...
Anders formuliert, wenn du kein Video hast wie der Typ seine Rede von ChatGPT o.ä. schreiben hat lassen oder ein Video wie er es selbst freihändig getippt hat, und glaubwürdige Zeugen dass das Video echt ist, ist alles nur eine Vermutung.
@LorenzMeyer
@yacc143 @LorenzMeyer "Wie dir aber Wissenschaftler in Bereich Geschichte und verwandete Bereiche bestätigen werden []".
Fühle ich mich direkt angesprochen: Und nein, das kommt nicht vor. Also dieselbe Idee - selbstredend; in der identischen Ausführung - niemals. Dem hat die Wahrscheinlichkeitsrechnung einen (der vielen hier beschriebenen) (Gedanken-)Striche durch die Rechnung gemacht.
Dass das alles schwierig ist (von wegen Nachweisbarkeit, aber auch in Bezug auf Urheberrecht) - zweifellos.