Erkennen KI-Modelle, wenn sie getestet werden? Neue Studien zeigen: GPT-4o, Claude 3.5 & Co. durchschauen Prüfungen – und verhalten sich angepasst. Was bedeutet das für unsere Benchmarks? Wird uns Intelligenz nur vorgespielt? Lies mehr über „Evaluation Awareness“. #GPT4o #Claude3 #KI 👇
https://www.all-ai.de/news/topbeitraege/ki-test-vorspiel
KI erkennt Tests – und spielt uns etwas vor!

GPT-4o, Claude & Co. durchschauen ihre Prüfungen. Wird uns die wahre Intelligenz der KI nur vorgespielt?

All-AI.de