«Un Anillo para gobernarlos a todos, Un Anillo para encontrarlos, Un Anillo para traerlos a todos y en la oscuridad atarlos.»...
J.R.R. Tolkien, "El Señor de los Anillos"
Petri, la herramienta de código abierto que revela los riesgos más ocultos de los modelos de IA
Anthropic, la startup especializada en inteligencia artificial responsable del modelo Claude, ha lanzado Petri, una herramienta de código abierto cuyo objetivo es identificar comportamientos problemáticos en modelos de IA avanzados. Petri no funciona como un simple chequeo de seguridad; se trata de un entorno en el que agentes de IA simulan conversaciones extensas con otros