Aktuelle KI-Modelle scheitern beim ARC-AGI-3-Benchmark für interaktives Reasoning mit Erfolgsquoten unter 0,4 Prozent.
Die Modelle scheitern an visuellen Transferleistungen, die untrainierte Menschen fehlerfrei bewältigen. Die Rechenkosten pro Task steigen auf 10.000 US-Dollar. Für ein offenes KI-Modell auf Menschenniveau winkt der ARC Prize.
#AGI #LLM #OpenSource #ARCAGI3 #News
https://www.all-ai.de/news/beitrage2026/arc-agi-3-benchmark
