From AI Act to Structured Testing of AI Systems

Your source for AI litera(cy|ture)

Du hast ja sicher nichts zu verbergen.

»Wir zeigen, dass große Sprachmodelle für #Deanonymisierung im großen Maßstab eingesetzt werden können. Freien Internetzugang vorausgesetzt kann unser Agent Nutzer von #HackerNews und Teilnehmer von #AnthropicInterviews allein anhand von pseudonymen Online-Profilen und Onlinebeiträgen mit hoher Genauigkeit identifizieren, was bei einer manuellen Recherche Stunden kosten würde.

Anschließend entwickeln wir Angriffsmöglichkeiten für Plattformen, die nicht frei zugänglich sind. Wir implementieren eine eine skalierbare Angriffspipeline, basierend auf zwei Datenbanken mit unstrukturierten Texten, die über pseudonyme Individuen oder von ihnen geschrieben wurden.«

https://arxiv.org/abs/2602.16800

"#KI" #Datenschutz #Pseudonymität #Anonymität #LLM #LinkedIn

Large-scale online deanonymization with LLMs

We show that large language models can be used to perform at-scale deanonymization. With full Internet access, our agent can re-identify Hacker News users and Anthropic Interviewer participants at high precision, given pseudonymous online profiles and conversations alone, matching what would take hours for a dedicated human investigator. We then design attacks for the closed-world setting. Given two databases of pseudonymous individuals, each containing unstructured text written by or about that individual, we implement a scalable attack pipeline that uses LLMs to: (1) extract identity-relevant features, (2) search for candidate matches via semantic embeddings, and (3) reason over top candidates to verify matches and reduce false positives. Compared to classical deanonymization work (e.g., on the Netflix prize) that required structured data, our approach works directly on raw user content across arbitrary platforms. We construct three datasets with known ground-truth data to evaluate our attacks. The first links Hacker News to LinkedIn profiles, using cross-platform references that appear in the profiles. Our second dataset matches users across Reddit movie discussion communities; and the third splits a single user's Reddit history in time to create two pseudonymous profiles to be matched. In each setting, LLM-based methods substantially outperform classical baselines, achieving up to 68% recall at 90% precision compared to near 0% for the best non-LLM method. Our results show that the practical obscurity protecting pseudonymous users online no longer holds and that threat models for online privacy need to be reconsidered.

arXiv.org

@praesolgka @echo_pbreyer Die Möglichkeiten der #DeAnonymisierung legt aber mit der LLM-/KI-Entwicklung zugleich auch zu. Ich glaube nicht, dass hier eine hinreichende Zuverlässigkeit durch automatische Verfahren erreicht werden kann.

Daher müssen Akten aller Verwaltungen von vorherein darauf angelegt werden, dass die darin beschriebenen Personen anonym sind – und auch bei Zusammenführen von öffentlichen Informationen anonym bleiben!

Doch das Verständnis dafür fehlt bei Entscheidenden in den Verwaltungen bislang völlig. #Datensparsamkeit und Trennung von Handlungen und Handelnden in zwei getrennte Datenbasen hab ich noch nirgends in der Diskussion durch Bund, Land und Kommunen erlebt. Im Gegenteil: Darauf angesprochen ernte ich völliges Unverständnis, wozu das gut sein könnte.

US-Regierung will Anonymität der Volkszählung aufheben

US-Regierung will Anonymität der Volkszählung aufheben. So könnte man dem gigantischen Datensatz auch die Namen der US-Bürger entnehmen.

TARNKAPPE.INFO

Weil ich es in einer Debatte gerade als Referenz benützte, habe ich diesen sehr erhellenden Vortrag auf einer Konferenz des @ccc zum Thema #Deanonymisierung von Daten wieder ausgegraben. Das Video ist echt sehenswert.

https://www.youtube.com/watch?v=K36fe7txXhQ

#Datenschutz #NSA #CCC #privacy

Build your own NSA (33c3)

YouTube

#Deanonymisierung von Nutzern:

Behörden unterwandern Tor-Netzwerk

Viele Nutzer, die im Netz anonym bleiben wollen, vertrauen auf das Tor-Netzwerk. Gerechtfertigt ist dieses Vertrauen aber nicht mehr. ...

https://www.golem.de/news/deanonymisierung-von-nutzern-behoerden-unterwandern-tor-netzwerk-2409-189076.html
Via @torproject

#Datenschutz #Privacy #Tor #Darknet #Antireport

Deanonymisierung von Nutzern: Behörden unterwandern Tor-Netzwerk - Golem.de

Viele Nutzer, die im Netz anonym bleiben wollen, vertrauen auf das Tor-Netzwerk. Gerechtfertigt ist dieses Vertrauen aber nicht mehr.

Golem.de

@dyfustic
Ja, ich finde #doctolib auch scheiße und mache einen großen Bogen um den Dienst.
Aus #Datenschutz|gründen.
Die bekommen und sammeln von den Ärzten viel mehr #Patientendaten (darunter auch Gesundheitsdaten), als zur Zweckerfüllung notwendig.

Gerade #Gesundheitsdaten können äußerst sensibel sein. Da schützt auch keine #Pseudonymisierung #Anonymisierung. Eine #Deanonymisierung oder #Depseudonymisierung ist zwar etwas aufwendig, aber leider auch kein Hexenwerk. Ein schneller Job für KI?

I2P Netzwerk: Deanonymisierung nicht ausgeschlossen

Laut Brian Boss und Marco Purtschert kann man eine Deanonymisierung von Teilnehmern innerhalb des I2P-Netzwerkes derzeit nicht ausschließen.

Tarnkappe.info
#t3N: #Anonymisieren statt #Löschen: Den eigenen #Datenschatz trotz #DSGVO-Löschpflicht heben
-> Alles richtig, nur müssen die gewählten #Anonymisierungs-Verfahren sicherstellen, dass keine De-Anonymisierung (#DeAnonymisierung) möglich ist und die Daten auch nach #Anonymisierung noch einen Nutzen/Wert haben. Ein in der Praxis nicht ganz einfaches Unterfangen.
https://t3n.de/news/datenschutz-dsgvo-loeschpflicht-1475781/
#ISMS-Blog
t3n – digital pioneers | Das Magazin für digitales Business

News + Artikel für die digitale Wirtschaft. Das führende deutschsprachige Medium rund um die Themen eBusiness, Zukunftstechnologien und digitales Arbeiten.