
Sockpuppeting: 1-Zeilen-Code hebelt KI-Schutzsysteme aus
Sockpuppeting: Mit nur einer Codezeile lassen sich KI-Schutzmechanismen umgehen. Selbst GPT, Claude & Gemini sind anfällig dafür.
TARNKAPPE.INFO
KI-Jailbreak Semantic Chaining: Neue Technik unterläuft KI-Schutzmechanismen
KI-Jailbreak Semantic Chaining knackte Grok 4 & Gemini Nano Banana Pro mit einem scheinbar unauffälligen linguistischen Bedeutungsmechanismus
TARNKAPPE.INFO
KI-Jailbreak: Gedichte umgehen KI-Sicherheitsfilter in 62 % der Fälle
Neue Studie zeigt: Ein KI-Jailbreak funktioniert sogar mit Gedichten. Adversarial Poetry umgeht KI-Sicherheitsfilter in 62 % der Fälle.
TARNKAPPE.INFO
KI Jailbreak knackt Sicherheitsfilter: Neue Angriffsmethode überlistet 99 % aller KI-Modelle
KI Jailbreak knackt Sicherheitsfilter: Eine neue Studie zeigt, dass Angreifer moderne KI-Modelle in bis zu 99 % der Fälle aushebeln können.
TARNKAPPE.INFO
KI kann andere KIs dazu bringen, „verbotene“ Dinge zu tun
Forscher:innen zeigen in einer Studie, wie sie KI-Modelle dazu bringen können, die ihnen eingeimpften Regeln z
t3n Magazin