Mal kurz abgesehen von der Sachebene:

ich finde es erstaunlich, dass dieselben Leute, die sich zurecht vor x Jahren über den Kampfbegriff „Raubkopierer" beklagt haben, jetzt bei ungefragtem KI-Training von öffentlichen Daten vom „größten Diebstahl der Geschichte“ reden.

Meines Wissens nach sind in beiden Fällen die Daten noch genau da, wie sie vorher auch waren.

@rstockm
Der Unterschied ist, wer davon profitiert, auf der einen Seite Einzelpersonen, auf der anderen Unternehmen

Für letzter hat man oft weniger Mitgefühl

@_GreyWolf Na ja - also ich profitiere ganz tüchtig davon.

@rstockm
Sind wir uns da sicher?
Letztendlich geht die Nutzung von KI mit einem De-Skilling einher. Tätigkeiten oder kognitive Leistungen die wir an ein LLM auslagern können wir bald nicht mehr eigenständig erbringen.

Ich fürchte wir bauen hier Abhängigkeit und Unmündigkeit auf. Wir denken nicht mehr selbst weil es bequemer ist das Maschinen zu überlassen. Maschinen die sich nicht einmal in unserer Kontrolle befinden.

@rstockm
Was passiert denn, wenn die Enshittification der LLMs los geht?
Aktuell raufen sich die AI Buden ja noch um Marktanteile, aber das wird aufhören. Irgendwann wollen die Kapitalisten Gewinne sehen.

Was passiert denn, wenn die LLMs das Fenster zu Welt werden, diese LLMs aber von wenigen, überreichen Männern kontrolliert werden?
Wir sehen ja etwa bei xAI wie der Eigentümer Musk seine faschistische Ideologie eintrainieren lässt.

@rstockm
Du profitierst davon monetär? Also hättest du diese Kunstwerke sonst alle gekauft ?

@rstockm Es ist dennoch Diebstahl geistigen Eigentums.

Der Begriff "Raubkopierer" impliziert Gewalt, da Raub immer ein Element von Gewalt mit sich bringt, zusätzlich zum Diebstahl.

Beim derzeitigen Vorgehen der KD*-Industrie kann man allerdings tatsächlich fast von Raub sprechen. Es ist eine Sache, sich über Kopierschutzmechanismen hinwegzusetzen, aber eine andere Sache, ganze Systeme lahmzulegen, weil man den Hals nicht voll bekommt.

*Künstliche Dummheit

@niemalsnever @rstockm die Diskussion ging damals aber nicht um das Messer in der Hand sondern um die Tauschbörse. Das Argument für das Wort war nie die Gewalt sondern immer der Diebstahl. Und das impliziert dass hinterher jemand etwas nicht mehr hat. Eine Armbanduhr, Geld, einen Kinofilm.
@rstockm
"größter Datenmissbrauch der Geschichte" wäre ein technisch treffenderes Wording, agreed. Wer LLMs nutzt, ist 1 widerliches Arschloch, egal ob das Original dabei noch vorhanden ist.
@rstockm bei offen lizenzierten Dingen wie FOSS sehe ich das ähnlich. Aber Blogposts zB die oft keine Lizenz haben stehen halt unter Copyright. Und da es hinweise gibt dass alle möglichen ebooks gefüttert wurden, muss man auch hier von "ausgebliebenen Käufen" ausgehen. Afaik ist Diebstahl da der richtige begriff. Raub passt ja nur nicht weil keine Gewalt angedroht wird (Raub ~ Diebstahl unter Androhung von Gewalt).
@rstockm welche Ebene ist es denn wenn nicht die Sachebene? Frage nur kurz um meine Antwort a la Devils Avocado abzuwägen :)
@hukl Es geht mir hier nur um die völlig unscharfen Begrifflichkeiten. „Raub“ beinhaltet die Anwendung oder Androhung von Gewalt, das war damals absurd. Und heute ist eine Kopie eben kein Diebstahl.

@rstockm
Eine Kopie von wem? AFAIK war eine Privatkopie von Bekannten immer erlaubt, deshalb ja auch die Urheberrechtsabgabe auf Datenträger.
Gewerbliche Kopien waren dagegen nicht erlaubt. Dementsprechend trifft Diebstahl die Sache IMHO schon. Es kommt ja auch noch dazu, dass auf relativ einfache Weise Plagiate erzeugt werden können, die dann wieder kommerziell verwertet werden können, ohne das der Urheber dafür entschädigt wird.

@hukl

@rstockm ah ja in die Definitionsdebatte muss ich nicht mit einsteigen :)

@rstockm ich glaube der Haupt Unterschied war das mit „Raubkopierern“ die Industrie vor allem **private** Leute gemeint hat die sich Kopien machen, dafür *zahlt* man ja Urheberrechtsabgaben auf CDR, USB Sticks etc.

Niemand hat damals gefordert, das andere Firmen z.B. Filme, Spiele, Bücher kopieren **und** selbst verkaufen dürfen.

Die LLM Trainingsdaten sind systematisch in einem riesigen Ausmaß bewusst und Vorsätzlich gegen Lizenzbestimmungen kopiert und benutzt worden für kommerzielle Zwecke.

@rstockm mal kurz weg von der Sachebene: ich finde es immer zweifelhaft, wenn in solchen Vergleichen von denselben Leuten gesprochen wird. Wirklich?
@rstockm ich würde auch die Prämisse in Zweifel ziehen, dass das die selben Leute sind.

@rstockm

Also ich hab mich noch nie über Raubkopierer:innen von Software aufgeregt (nur bei Schriftarten hört der Spaß auf ;) ).

Bei KI aber schon. Die Daten sind zwar noch da, wo sie vorher waren, aber zusätzlich danach auch dort, wo sie nicht hingehören.

Vor allem sind es ja die großen Player wie Microsoft, die sich barbarisch über Software-Piraterie aufregen, aber jetzt für KI Training ungerührt im massiv (!) gewerblichen Umgang Urheberrechte verletzen und darüber hinaus dazu anstiften (Stichwort Harry Potter sei ja Gemeingut, höhö).

Du meinst bestimmt Code Generatoren, sagst sogar im Thread hier, dass Du davon profitierst (ich nehme an, wieder von Code Generatoren), aber Du sagst es nicht, Du sprichst von "KI".
AI ist aber doch viel mehr.

Ich habe ein Problem sehr spezifisch bei generativer AI für Musik. Haufenweise Streaming Dienste, egal ob kommerziell oder frei werden durchgerippt damit Hipster Bruno sich seinen privaten Café Latte Song im Stil von St. Germain generieren kann. Wie geil.

Meine Idee, als Musikmachender, ist, Musik als zusätzliches Ausdrucksmittel zu verstehen, als eine universell verständliche Sprache von Emotionen. Schöne Scheisse, wenn diese gewaltige Kraft, die sämtlicher echter Musik innewohnt, durch AI völlig egal, Wurscht, riesel wird. Wenn das zersetzt wird, wenn dieser unglaubliche Schatz von lebendem Kulturgut zerrissen und durch billigstes Plastik ersetzt wird.

Oder Du als Bibliothekar? Macht es Dir Spaß, AI generierte Bücher zu lesen? Oder gewinnbringend generieren zu lassen? Feierst Du das? Oder macht das pure Wissen ob der Existenz dieser Möglichkeiten UND deren Akzeptanz was mit Dir?

AI ist eben ein zweischneidiges Schwert - kommt wie immer auf das Wo und Wie an.

Und dass das Wort "Diebstahl" verwendet wird... ja, da kann man sich natürlich mokieren. "Raubkopie" ist ja immerhin ein ausgesprochen passender Begriff.

@rstockm es ging nie um die Daten. Es ging immer im den entgangenen Gewinn.
@rstockm Jop. 🙂 Zumal die Daten als Kondensat vorliegen und nicht in Reinform. Sie werden quasi rekreiert, wenn man danach fragt.