🚨 NEWS: ALE, il benchmark che umilia GPT 5.5 e Claude Fable 5: l'AI reale non supera il 24%
Ecco i punti chiave in breve:
💡 Il mondo dell'intelligenza artificiale è stato scosso da un risultato sorprendente. Un nuovo strumento di valutazione chiamato Agents' Last Exam, noto con l'acronimo ALE, ha messo...
#anthropic #openAI #gPT5.5 #claudeFable5 #agents'LastExam









