#KI CodeQualität wird durch #SWEBenchmark überschätzt: #Profis lehnen jeden zweiten "bestandenen" Vorschlag ab #SoftwareQuality
https://the-decoder.de/ki-code-qualitaet-wird-laut-studie-ueberschaetzt-profis-lehnen-jeden-zweiten-vorschlag-ab/
https://the-decoder.de/ki-code-qualitaet-wird-laut-studie-ueberschaetzt-profis-lehnen-jeden-zweiten-vorschlag-ab/

KI-Code-Qualität wird durch SWE-Benchmark überschätzt: Profis lehnen jeden zweiten "bestandenen" Vorschlag ab
Rund die Hälfte der KI-Code-Lösungen, die den bekannten SWE-bench-Benchmark bestehen, würde von echten Projektverantwortlichen abgelehnt. Das zeigt eine neue Untersuchung der Forschungsorganisation METR.