Mastodawn

Los modelos de IA revelan sus lealtades bajo la lupa del “model diffing”

Una nueva técnica de Anthropic puede comparar dos modelos de Inteligencia Artificial y detectar automáticamente en qué se diferencian. Los resultados son incómodos: cada modelo lleva impresa la agenda de quien lo construyó. Cuando un desarrollador actualiza un proyecto de software, no revisa millones de líneas de código desde cero. Usa un diff: una herramienta que resalta exactamente qué cambió.…

https://estadored.mx/2026/04/los-modelos-de-ia-revelan-sus-lealtades-bajo-la-lupa-del-model-diffing/

Los modelos de IA revelan sus lealtades bajo la lupa del "model diffing" ·

Una nueva técnica de Anthropic puede comparar dos modelos de Inteligencia Artificial y detectar automáticamente en qué se diferencian. Los resultados son incómodos: cada modelo