RE: https://mastodon.social/@AwetTesfaiesus/116340595836143259

Ein Mal das Gerechtigkeitsempfinden aller billig und gerecht denkenden Nerds getestet.

Ich denke, das empfinden steht nicht unbedingt im Einklang mit geltenden Recht. Ich würde auch sagen, die Büchse der Pandora ist sehr weit offen.

Die Frage ist: was folgt nun daraus?
(Bitte gern bevorzugt gewaltfrei aber radikale Ideen)

@AwetTesfaiesus ein Recht, frei von Interaktionen mit KI leben zu können. Auch als Orts- und Lebensgemeinschaft. Sozialen ein Bioland-Hof für Menschen und ihre Daten.
@AwetTesfaiesus
Grundsätzliches verbot für #llm bzw. #ki zum lernen aus promts. Das, was im Internet veröffentlicht ist und wird muss reichen.
@SebastianGallehr @AwetTesfaiesus Wäre glaube ich nur eine Teillösung. Wenn ich wirklich einen Prompt auf der Basis dieser Info meine zu brauchen, dann wird unter dieser Bedingung sehr schnell dieser Kontext auf einer Zusatzseite "llmcontext.ai" oder so eingestellt. Diese Seite hostet Kontextstrings und gibt denen UUIDs auf die ich mich im Prompt beziehen-> zack, gedribbelt
@brewbart Warum nicht aus einem geschlossenen geprüften Datenpool trainieren? Das ganze Internet ist viel zu riskant. Vielleicht 80% Schrott. Die Wahrscheinlichkeit, dass LLMs auch Schrott produzieren ist zu hoch. @SebastianGallehr @AwetTesfaiesus
@energisch_ @SebastianGallehr @AwetTesfaiesus -> Mein anderer Kommentar :) Also man müsste die Dinger zerschlagen, aber krieg das mal hin. Selbst wenn, wirst du glaube ich kaum kontrollieren können was da wer zum Anlernen anschließt, der Zug ist für die öffentlich verfügbaren längst abgefahren
@brewbart
Das glaube ich nicht. Ich habe den Glauben an und an die ordnende Kraft einer, auf Gewaltenteilung basierenden wertebasierten Grundordnung noch nicht aufgegeben. Also glaube ich daran, das wir Regeln aufstellen können, die Freiheit ermöglicht unsd sichert.
@energisch_ @AwetTesfaiesus
@SebastianGallehr @energisch_ @AwetTesfaiesus Ich drücke sehr die Daumen, dass dir das erhalten bleiben kann. Ich sehe nur, dass wir in einer Zeit der dreisten Techbros sind die schneller Geister aus Flaschen befreien und so viele Umkehrpunkte überspringen, dass die Judikative gerade bei Checkpunkt 1 ankommt während schon sieben Kilometer weiter die nächste Brücke brennt
@brewbart
Kann sein, dass du Recht hast. Alles ist verloren und wir enden als Sklaven der Tech Bros. Dabei nur zuschauen ist für mich keine Option. Ich als kleines pazifistisches Licht muss also eine Haltung entwickeln, wie es aufzuhalten ist. Gewaltenteilung!
Unsere Gewaltenteilung funktioniert aber ausschließlich dann, wenn wir Menschen dran glauben, sie einfordern und ihr uns ergeben.
@energisch_ @AwetTesfaiesus
@brewbart @energisch_ @SebastianGallehr @AwetTesfaiesus
Wenn als Grundlage gilt, es gibt nur ein Gesetzt, und das bezieht sich auf alle, auch die digitalen Teile von Welt,
Dann wäre die Folgerung - die #KI ist als digitale #Persona genauso justiziabel wie jede analoge. Die #AI erhält #Persönlichkeitsrechte (die Sanktionierung wird sie selbst, und auf dem Umweg über sie, die Inhaber und Betreuer treffen, anders gesagt, die Strafe die die KI bekommt, zahlen ihre Betreiber und investoren, klar).

@brewbart @energisch_ @SebastianGallehr @AwetTesfaiesus
Das wird auch die Bereitschaft erhöhen, sozial verantwortlicher #Algoritmen zu entwickeln und die #KI #Bot #ChatBot selbst 'erwachsener', verantwortlicher zu gestalten, mit nicht weniger, sondern mehr #Daten
#Datenschutz war mal. regulieren, filtern, #demokratisieren kann man aber, indem die #LLM nicht nur Persönlichkeitsrechte, sondern auch #Persönlichkeit bekommt (Anführungszeichen), wir brauchen die GUTE KI

#Loesung #KIAssistent

@Hans_Kastell @energisch_ @SebastianGallehr @AwetTesfaiesus Erinnert mich an meine letzte Vorlesung Robotik/Bildverarbeitung wo der Prof eine große Kelle Ingenieursethik verteilt hat - Thema Gesichtserkennung und Datenverknüpfung. Wäre schön, würden wir da eine Handhabe entwickeln können, die Betreiber und Entwickler dieser Software zur Rechenschaft zu ziehen.
@brewbart Einfach, füge keinen Schaden zu. Fehler in der Erkennung sind nicht zu vermeiden, auch Lecks durch Datensammlungen können nie vermieden werden. Deshalb: sparsam mit Daten, aber dann funktioniert auch keine Erkennung. Also besser sein lassen. Schaden ist vorprogrammiert und nicht zu vermeiden. @Hans_Kastell @SebastianGallehr @AwetTesfaiesus
@energisch_
Stimmt. Viel Schrott im Internet. So wie in den Köpfen von uns Menschen. Das ki je die Wahrheit sagt, ist eh illusorisch. Also muss jede KI Aussage eh immer gründlich überprüft werden.
Hier ging es mir um eine dsgv konforme Grundforderung.
@brewbart @AwetTesfaiesus
@AwetTesfaiesus Ich denke eine datenschutzrechtliche Kontrolle ist ohne Zerschlagung der größten Modelle nicht mehr möglich. Neuronale Netze sind eine so überkomplizierte Datenstruktur, was einmal in die Gewichte gekommen ist kriegst du nie mehr raus. Auch wenn du einen konkreten "Gedächtnisteil" kontrollieren kannst, die Wahrscheinlichkeitsverteilung bereinigen - no way. Was ein Teilansatz sein könnte wäre eine Pflicht zur Kontexttransparenz (siehe https://arxiv.org/abs/2410.12586v2) (1/2)
How to Make LLMs Forget: On Reversing In-Context Knowledge Edits

In-context knowledge editing (IKE) enables efficient modification of large language model (LLM) outputs without parameter changes and at zero-cost. However, it can be misused to manipulate responses opaquely, e.g., insert misinformation or offensive content. Such malicious interventions could be incorporated into high-level wrapped APIs where the final input prompt is not shown to end-users. To address this issue, we investigate the detection and reversal of IKE-edits. First, we demonstrate that IKE-edits can be detected with high accuracy (F1 > 80\%) using only the top-10 output probabilities of the next token, even in a black-box setting, e.g. proprietary LLMs with limited output information. Further, we introduce the novel task of reversing IKE-edits using specially tuned reversal tokens. We explore using both continuous and discrete reversal tokens, achieving over 80\% accuracy in recovering original, unedited outputs across multiple LLMs. Our continuous reversal tokens prove particularly effective, with minimal impact on unedited prompts. Through analysis of output distributions, attention patterns, and token rankings, we provide insights into IKE's effects on LLMs and how reversal tokens mitigate them. This work represents a significant step towards enhancing LLM resilience against potential misuse of in-context editing, improving their transparency and trustworthiness.

arXiv.org
@AwetTesfaiesus Zusätzlich müsste es einen Datenschutzlayer geben der Antworten auf Konformität prüft, also sobald da kontextexterner, schützenswerter Inhalt generiert wird darf dieser entweder nicht zum User geleitet werden oder muss hypothetisiert / gescrambelt werden. Gleichzeitig sollte in diesem Fall eine Strichliste bei einer Datenschutzkartei geführt werden: Wenn dein Produkt regelmäßig gegen Recht verstößt hagelt es so viele Strafen, dass deine Wirtschaftlichkeit über Bord geht (2/2)
@AwetTesfaiesus Nachtrag: Woher weiß ein llm was echte schutzwürdige Daten sind und was nicht? Also ohne Abgleich mit bspw Einwohnermeldeamtdaten. Da haben wir wieder das Grundproblem der Datensammlung. Ein Anwendungsfall ist die LLM Persona, die für erste Akzeptanztests genutzt wird von unempathischen Leuten mit zu viel Geld..
@brewbart aus dem Prompt?
@AwetTesfaiesus Das klärt aber nur den Fall, wenn wer direkt danach fragt! Und in Falle "Persona im großen LLM" muss ich ja auch garantieren, dass wenn ich meine Persona "Marlis Meier" nenne, dass keine wirklichen Daten zu einer Marlis Meier ausgegeben werden

@AwetTesfaiesus Datenschutz ist wichtig, aber heutzutage auch extrem schwierig.

Das anerkennend dürfen wir ihn nicht aufgeben, aber wir müssen auch verstärkt die Folgen seiner Verletzung minimieren.

@AwetTesfaiesus In erster Linie interessiert mich, ob Einwohner*innenmeldeämter immer noch Adressdaten verkaufen dürfen? Ob sichergestellt ist, daß AI-Unternehmen diese nicht erwerben können?
Ansonsten frage ich seit Jahren Personen, die mir ihre Kontaktdaten geben, wo und wie ich sie speichern darf und erkläre, daß sie nicht bei Google oder WhatsApp landen, da ich dort nicht für die Einhaltung der DSGVO garantieren kann.

@AwetTesfaiesus Prinzipiell speichere ich möglichst gar keine Kontaktdaten was regelmäßig zu Erstaunen führt, wenn Personen mir Jahre später erneut ihre Adresse geben müssen.

Damit ist für mich auch die Frage beantwortet: ohne Einverständnis zur Datenverarbeitung darf ich keine persönlichen Daten weitergeben. An keine EDV und an keine andere Person.

@AwetTesfaiesus Die Begründung "ist öffentlich einsehbar" halte ich nicht für stichhaltig, denn damit würden auch Porno-Deepfakes mit im Netz auffindbaren Fotos legalisiert.

Die DSGVO gibt das vor: Datensparsamkeit und Nutzung nur mit Einwilligung zu bestimmten Zwecken sowie Löschung auf Verlangen.

@regineheidorn soweit ich weiß, werden sie immer noch verkauft
@AwetTesfaiesus in den vielen Antworten tauchen soviele Begrifflichkeiten auf, mit denen ich nix anfangen kann, Fachsprech, das alle betrifft und nicht alle verstehen.
Ich fasse es so zusammen: die Menschheit müllt sich voll mit Lärm, Licht, Müll auf dem Lande, zu Wasser, in der Luft in allen Größendimensionen und jetzt auch mit Daten. Ich stelle da die Frage: inwieweit hilft der Datenmüll der Menschheit ihre Mitwelt, ihre Lebensgrundlage zu erhalten?

@AwetTesfaiesus
Rückkehr zur Rechtsstaatlichkeit 😉.

Klar scheint mir, DSGVO deckt das ab (bringt moralisches Empfinden und Recht in Einklang), und zwar auf Seite von OpenAI. ChatGPT muss prüfen, ob das möglicherweise personenbezogene Daten sind (bei diesem Namen z.B. gar kein Problem) und die Verarbeitung verweigern ( "... um die geetzl. Grundlage zu prüfen, treten Sie bitte in Kontakt mit unserem legal support team" ). Das klingt nur deshalb absurd für manche Leute, weil sich schon alle daran gewöhnt haben, dass sich Techoligopole nicht in gleichem Maße wie wir an Gesetze halten müssen, wenn es das Businessmodell beeinträchtigen könnte.

@AwetTesfaiesus was ich mir wünsche, wäre eine strenge Interpretation der DSGVO, daß Trainingsdaten *gesichert* von persönlichen Information frei sein müssen. Wenn das nicht machbar ist, gibt's halt die Sprachmodelle nicht, Punkt. Es gibt kein Gottgegebenes Recht Auf Geschäftsmodell. Wenn eine solche Bereinigung behauptet aber nicht vollständig durchgeführt wird, persönliche Strafen für die Firmenleitung, bemessen an deren Vermögen, nicht Einkommen.

(Ja, ich habe allerlei gegen dieserlei "KI", bei dem Namen angefangen. Es wäre nicht schade drum, ganz im Gegenteil.)

(Und wo ich dabei bin, ja, auf jeden Fall diese DSGVO-Interpretation ausdehnen auf ein faktisches Verbot verhaltensbasierter Werbung, durch Wegfall von "berechtigtem Interesse". Schon als Selbstzweck, aber auch für den großen Bonus: Diese Werbungsmaschinerie ist der wichtigste Antrieb für die Radikalisierung der großen (dadurch anti-)sozialen Medien.)

@AwetTesfaiesus

Zählt Kapitalismus anzünden unter gewaltfrei?

Ich sehe nicht, daß wir rechtlich irgendwas sinnvoll tun können, vor allem auch da es großen Teilen der Politik erstaunlich egal ist, was international mit unseren Daten passiert – ob das jetzt der Umgang mit unseren Gesundheitsdaten¹ oder den Einsatz von Palantir² betrifft, Verträge mit Microsoft³ (Cloud) usw.

Da seh ich die Verarbeitung einzelner Adreßdaten durch einen Chatbot in der Priorität sehr weit unten.⁴ Wenn wir politisch was reißen wollen, dann ist das kein gutes Beispiel. Wir brauchen größere Erzählungen.

__
¹https://gi.de/meldung/epa-datenschutzrechtliche-bedenken
²https://netzpolitik.org/2025/baden-wuerttemberg-gruene-geben-polizeidaten-fuer-palantir-frei/
³https://owncloud.osb-alliance.de/apps/richdocuments/documents.php/public?fileId=&shareToken=hDU4sviaDZLzNCb
⁴wir könnten Chatbots auch gezielt mit falschen Addressdaten füttern, aber auch das heizt den Planeten weiter auf.

Elektronische Patientenakte: Datenschutzrechtliche Bedenken und mangelnde Kontrolle

Der Arbeitskreis Datenschutz und Datensicherheit der Gesellschaft für Informatik e.V. sieht die aktuelle Umsetzung der elektronischen Patientenakte mit großer Sorge. Er hat klare Forderungen aufgestellt, um die informationelle Selbstbestimmung der Bürgerinnen und Bürger zu schützen.