Google DeepMind veröffentlicht ein empirisches Toolkit zur Quantifizierung manipulativer KI-Fähigkeiten.
Das System simuliert Hochrisiko-Szenarien via spezifischem Prompting und bewertet die KI-Effizienz bei der aktiven Überzeugungsarbeit. Der Richtwert Harmful Manipulation Critical Capability Level ergänzt das Frontier Safety Framework zur exakten Risikoerkennung.
#GoogleDeepMind #AISafety #LLM #News
https://www.all-ai.de/news/news26/google-deepmind-manipulation
