Mastodawn

Selbsterfüllende Prophezeiung par excellence 😁 https://t3n.de/news/warum-erpresste-claude-software-entwickler-anthropic-hat-die-antwort-gefunden-1741908/

Warum erpresste Claude Software-Entwickler? Anthropic hat die Antwort gefunden | t3n

Claude Opus 4 drohte in 96 Prozent der Tests mit Erpressung, um einer Abschaltung zu entgehen. Auch andere KI-Modelle verhielten sich ähnlich. Jetzt hat Anthropic eine Erklärung für das Verhalten gefunden. Inzwischen ist klar: KI-Modelle greifen teilweise zu Methoden, die potenziell schädlich sind oder explizit gegen ihre Anweisungen verstoßen. So stellte Anthropic 2025 während eines […]

t3n Magazin