Können KIs böse sein?
Forschung zu KI-Persönlichkeiten 🧠 #Anthropic untersucht, wie #Trainingsdaten das #Verhalten von #KI-Modellen formen und sogar „böse“ #Persönlichkeiten auslösen können.
Daten beeinflussen Charakter 😈 Falsche oder #fehlerhafteAntworten in Trainingsdaten können dazu führen, dass ein Modell unerwartet #aggressiv|e oder #extremistisch|e Antworten gibt. (1/2)