Aktuelle KI-Modelle scheitern beim ARC-AGI-3-Benchmark für interaktives Reasoning mit Erfolgsquoten unter 0,4 Prozent.

Die Modelle scheitern an visuellen Transferleistungen, die untrainierte Menschen fehlerfrei bewältigen. Die Rechenkosten pro Task steigen auf 10.000 US-Dollar. Für ein offenes KI-Modell auf Menschenniveau winkt der ARC Prize.

#AGI #LLM #OpenSource #ARCAGI3 #News
https://www.all-ai.de/news/beitrage2026/arc-agi-3-benchmark

KI-Modelle versagen beim ARC-AGI-3-Test

Der neue Benchmark zeigt die Schwächen moderner KI beim interaktiven Reasoning. Menschen lösen diese Aufgaben problemlos.

All-AI.de