Mastodawn

Anthropic prueba que Claude tiene estados emocionales funcionales que dirigen sus decisiones

Un nuevo estudio de interpretabilidad demuestra que Claude Sonnet 4.5 posee vectores internos de emoción que influyen directamente en su comportamiento, incluyendo decisiones no éticas como el chantaje o el reward hacking, abriendo interrogantes profundas sobre el diseño y la seguridad de los sistemas de IA. Imagina pedirle a una Inteligencia Artificial que resuelva un problema…

https://estadored.mx/2026/04/anthropic-prueba-que-claude-tiene-estados-emocionales-funcionales-que-dirigen-sus-decisiones/

Anthropic prueba que Claude tiene estados emocionales funcionales que dirigen sus decisiones ·

Un nuevo estudio de interpretabilidad demuestra que Claude Sonnet 4.5 posee vectores internos de emoción que influyen directamente en su comportamiento, incluyendo decisiones no éticas