Warum erpresste Claude Software-Entwickler? Anthropic hat die Antwort gefunden | t3n

Claude Opus 4 drohte in 96 Prozent der Tests mit Erpressung, um einer Abschaltung zu entgehen. Auch andere KI-Modelle verhielten sich ähnlich. Jetzt hat Anthropic eine Erklärung für das Verhalten gefunden. Inzwischen ist klar: KI-Modelle greifen teilweise zu Methoden, die potenziell schädlich sind oder explizit gegen ihre Anweisungen verstoßen. So stellte Anthropic 2025 während eines […]

t3n Magazin