Mastodawn

Google DeepMind veröffentlicht ein empirisches Toolkit zur Quantifizierung manipulativer KI-Fähigkeiten.

Das System simuliert Hochrisiko-Szenarien via spezifischem Prompting und bewertet die KI-Effizienz bei der aktiven Überzeugungsarbeit. Der Richtwert Harmful Manipulation Critical Capability Level ergänzt das Frontier Safety Framework zur exakten Risikoerkennung.

#GoogleDeepMind #AISafety #LLM #News
https://www.all-ai.de/news/news26/google-deepmind-manipulation

Google DeepMind: Neues Verfahren misst schädliche KI-Manipulation

Forscher bewerten erstmals systematisch, wie künstliche Intelligenz menschliches Verhalten durch gezielte Täuschung beeinflusst.

All-AI.de