Stack Overflow hat auf der eigenen Webseite folgenden Claim:

Und damit folgt ein Thread zu Wissen, Besitzansprüchen und warum der Deal dahinter bei Stack Overflow nicht mehr gilt (und wahrscheinlich für alle anderen möglichen ähnlich gearteten Plattformen)

Was ist geschehen: Stackoverflow hat einen Deal mit OpenAI abgeschlossen, User revolutieren jetzt gegen die Monetarisierung und StackOverflow verbannt die revolutierenden User. So weit so verstörend.

https://arstechnica.com/information-technology/2024/05/stack-overflow-users-sabotage-their-posts-after-openai-deal/

Stack Overflow users sabotage their posts after OpenAI deal

Anti-AI users who change or delete answers in protest are being punished.

Ars Technica

Nun wird das oder ist in letzter Zeit immer wieder passieren: Plattformen, die Daten ihrer User*innen einseitig monetarisieren.

Plattform macht dazu dann rgendwas mit AI, entweder selbst oder begibt sich in die Fänge von Tech Monopolisten, verhökert dazu die Daten der User*innen und schöpft den Wert einseitig selbst ab.

Die User*innen schauen dabei in die Röhre, werden vielleicht damit vertröstet, "Teil etwas Größeren zusein" oder das "für das Gemeinwohl" zu tun.

Plattformen wie Stackoverflow haben User*innen mit einem Versprechen angelockt, Hilfe zu bekommen oder im Gegenzug Hilfe geben zu können.

Das klingt erst mal sehr selbstlos. EIne Plattform, die User*innen dabei hilft, sich gegenseitig zu helfen.

Die Plattformen traten dabei lange selbst in den Hintergrund. Sie wurden eher zu einer Art Marktplatz ohne scheinbar besondere Eigeninteressen (Stack Overflow machte Geld mit Verkauf des Softwarestacks für Unternehmen).

Natürlich waren das am Ende immer noch Wirtschaftsunternehmen, die mit irgendwas Geld verdienen musste. Lange Zeit ging das bei Stack Overflow auch relativ gut - weil das Konzept erst mal relativ gut in einer – Achtung alter Marketing Begriff – Web 2.0 Welt funktioniert.

2021 wurde Stack Overflow von Prosus für 1,8 Milliarden gekauft.

»Die gesamte Firma bleibt so, wie sie jetzt ist – wir haben lediglich neue Eigentümer«.

Prosus ist aber ein Investment-Unternehmen.

https://www.spiegel.de/netzwelt/web/prosus-kauft-stack-overflow-investmentfirma-zahlt-1-8-milliarden-dollar-fuer-programmierer-portal-a-75641c97-c043-4b2d-adcd-75cd59e2f866

Prosus kauft Stack Overflow: Investmentfirma übernimmt Programmierer-Portal für 1,8 Milliarden Dollar

Wer nicht zur Szene gehört, hat davon noch nie gehört. Doch für Millionen Entwickler ist Stack Overflow ein unverzichtbares Werkzeug. Jetzt wechselt die Plattform den Besitzer. Was bedeutet der Deal?

DER SPIEGEL

Bemerkenswert: 2022 war ChatGPT noch Stack Overflows Feind, weil deren synthetischer Content die Qualität der Fragen und Antworten – Kerngeschäftsmodell – störte.

https://www.theregister.com/2022/12/05/stack_overflow_bans_chatgpt/

Stack Overflow bans ChatGPT as 'substantially harmful' for coding issues

High error rates mean thousands of AI answers need checking by humans

The Register

2024 hat sich das geändert, der Schlenker 2022 ist nicht unbedingt ungewöhnlich, um den Preis für eine Kooperation hoch zu treiben.

Sich erst klar qualitativ abgrenzen wollen, dann aber doch kooperieren.
Ein schon 2022 mit ChatGPT geflutetes Stack Overflow wäre jetzt quasi nichts mehr wert.

Edit: Die Non AI policy von Stack Overflow hielt nur bis etwa Mitte 2023 (danke an @ePD5qRxX ) - ändert aber nichts an der Verzögerungstaktik

In dem Deal von Stack Overflow zieht Stack Overflow eher den kürzeren, weil sie ja quasi "nur" Contentlieferant sind.

Die User*innen-Basis und das Versprechen, etwas "für die Community" getan zu haben, ist da nicht mehr relevant.

OpenAI drückt da StackOverflow finanziell und vom Einfluss gegen die Wand:

Am Ende bleibt für die User*innen das Bewusstsein, dass der Deal "kostenloses Arbeiten an Wissen fürs Gemeinwohl" am Ende ganz gemein nur der Plattform dient.
War schon immer so, leider.

Nur sind die Zeiten jetzt so raffgierig geworden, dass das schneller auffällt. Hart, aber immerhin ehrlich.

Was am Ende wesentlich ist für die Stack Overflow Contributoren:
a) euer Content ist im wahrsten Sinne des Wortes wertvoll
b) ihr könnt den bequemen Weg über eine Plattform gehen, der hat aber einen Preis
c) Kopf hoch, im Gegensatz zu statistischen Datenverbrennern könnt ihr auch aus dem Nichts aus Daten und Informationen erzeugen – auch wenn die AI-Guys euch etwas anderes erklären werden. Weil ihr alle kreative Menschen seid

@bkastl

Ich möchte das Gegenbeispiel Wikipedia nennen. Wikipedia hat einem Mann (Jimmy Wales) gehört und wurde aus Risikokapital aufgebaut (der Firma von Wales: Bomis). Wales hat das Projekt aber nicht monetarisiert, sondern an eine Stiftung (WMF) übertragen.

@Life_is eine noble Ausnahme aber eine seltene
@bkastl @Life_is einer der Gründe, warum ich bei allem was mit community wirbt auf den Eigentümer schaue. Foundation/Stiftung/gemeinnützig - alles nicht 100% wasserdicht, aber schon ein guter Indikator
@bkastl Überrascht mich tbh nicht, das ist seit 2019 schon das vierte oder fünfte (mir bekannte!) Mal, dass SO die Community übern Tisch zieht...

@bkastl Hm, Unpopular Opinion: ich als Nutzer hab doch trotzdem einen direkten Vorteil von SO. Ich stelle Fragen und bekomme sinnvolle Antworten. Ist für die Nutzer:innen also immer noch ein guter Tausch, oder? Und die Daten sind zusätzlich auch noch unter CC-BY-SA verfügbar.

Also: dass die SO-Daten von OpenAI verwendet werden, find ich auch nicht gut. Aber generell hätte ich kein Problem damit, wenn StackExchange an den Daten verdient – nur OpenAI ist halt ein unschöner Abnehmer.

@ollibaba Der Tausch mag wertvoll sein, er findet aber auf nicht neutralem Grund statt. Das heißt nicht, dass der Tausch schlecht ist, das Problem ist, dass sich alle im Glauben an einen fairen Tausch einen Mittelsmann eingekauft haben. Kannste machen, musste aber wissen.

@bkastl Ein Vorteil, den ein FediSO hätte, wäre vllt. wirklich der fehlende Druck zum Geldverdienen.

Mein Eindruck ist, dass StackExchange lange sehr verzweifelt nach Geschäftsmodellen gesucht hat. Und interessanterweise gibt es auch nach 16 Jahren wenig Rivalen (maximal Quora und Reddit, oder?).

Das deutet evtl. darauf hin, dass mit Q/A-Seiten einfach kein Geld verdient werden kann :-) und da könnte ein Community-betriebenes SO also die Nische besser besser ausfüllen.

@bkastl

Ich möchte darauf verweisen, daß der #ActivityPub `Question` type für offene Fragen konzipiert ist, als auch für polls wie bei mastodon.
Siehe https://www.w3.org/TR/activitystreams-vocabulary/#questions und Definition im gleichen Dokument.

Wenn also mal irgendwer ActivityPub "conformant" nutzt, so, wie es eigentlich gedacht war hätten wir länst ein föderiertes stackoverflow.

Activity Vocabulary

@sl007 Wieder eine gute Idee in Theorie, die sich aber leider nicht so wirklich durchgesetzt hat :/

@sl007 @bkastl Ich fänds super, wenn es eine "offene" Alternative zu SO gäbe; aber ich vermute, das ist nicht so sehr eine technische Herausforderung, sondern braucht:
- gute Moderation (Leute, Tools, Regelfindung). Hier kommt das Fediverse allmählich in Fahrt, holpert aber manchmal noch, oder?
- gute Usability (oft schwierig bei FLOSS)
- gute Reflektion darüber, was gut oder schlecht läuft (das seh ich bei FLOSS-Projekten eher wenig).

FediSO _könnte_ also funzen, wird aber echt schwierig :-)

@sl007 @bkastl das würde das Problem ja prinzipiell nicht lösen - auf Stackoverflow wurden ja viele Probleme besprochen, die beruflicher Natur waren - sprich die Antworten mussten unter einer freien Lizenz stehen, um nutzbar zu sein. Und das müsste bei einer Föderierten Lösung ja genauso sein. Und damit wäre das alles gleich wieder für AI abgreifbar :(
@xylakant
Das kommt darauf an. Jede Outbox kann sich so wie sie möchte mittels throtteling etc. gegen scraping schützen, sprich wir können es der AI schwieriger machen, so daß die einfach mehr Bock auf s.o. hat
@bkastl

@sl007
Wenn ich als AP compliant service im Fediverse mich mit anderen Instanzen verbinde, kann niemand mich von regulären Instanzen unterscheiden. Dann brauche ich kein scraping am AP Protokoll vorbei.

Das Fediverse ist vom Prinzip her public.

Leider ist das technisch nicht lösbar.
@xylakant @bkastl

@beandev @xylakant @bkastl

Hier sprecht Ihr aber ein ganz anderes Problem an. Es ging ja um die Auswertung von KI.

Das google mastodon scrapet, liegt nur daran, daß mastodon es in der robots.txt erlaubt.

Instanzen untereinander haben zusätzlich AGBs und können andere bei Misachtung sperren.

Wie das auf anderen Kontinenten so funzt, weiss ich nicht. Innerhalb der EU stellt das kein Problem dar (jedenfalls für die Kunden, für die ich Fediverse Software programmiere).

@sl007
Auf die AGB und Lizenzen wird gepfiffen. Das wissen wir bereits, weil es dazu schon Beispiele gibt. Der Zugriff über HTML und scraping ist sowieso zu aufwendig. Entweder betreibe ich eine Schatteninstanz oder hänge mich grundsätzlich an lokale oder föderierte Streams beispielsweise der Mastodon-Instanzen. Das technisch geht aus Prinzip nicht zu verhindern. Dann wäre es kein Fediverse mehr.

Fediverse Daten liegen offen dar.
@xylakant @bkastl

@bkastl

Das hat sich bereits 2023 geändert, als "KI" erzeugter Content nicht mehr durch Mods geahndet werden durfte (weil die Tools zu schlecht wären und es unfair gegenüber nicht Englisch sprechenden Usern ist) - bzw. nur wenn der User selbst zugibt das es KI-Content ist.

https://meta.stackexchange.com/q/389582

What is the network policy regarding AI Generated content?

Earlier this week, Stack Exchange released guidance to moderators on how to moderate AI Generated content. What does this guidance include?

Meta Stack Exchange
@ePD5qRxX one of error 🤪 (danke)

@bkastl
> Lange Zeit ging das bei Stack Overflow auch relativ gut

SO hat ja gutes Geld mit Stellenanzeigen verdient und das passte auch gut zur Entwicklercommunity. Als sie das ohne Not eingestellt haben, war klar, dass es mit SO steil bergab gehen würde. Vermutlich stand schon damals dahinter aber auch ein Wachstumsproblem; die Nicht-IT-Bereiche von StackExchange waren vermutlich immer nur Balast. Selbst SO im Kern hat -- zumindest gefühlt -- stark an Bedeutung verloren.