KI-Forscher fordern bessere Teststandards für KI-Systeme. Besonders Red Teaming durch unabhängige Dritte soll Risiken wie Hassrede oder Urheberrechtsverletzungen sichtbar machen. Erste Ansätze kommen vom Project Moonshot in Singapur.

👉 https://www.cnbc.com/2025/06/22/ai-chatbot-problem-harmful-outputs-standards-and-tests-red-teaming-researchers.html

#KIEvaluation #RedTeam #KIStandards #VertrauenInKI #KIRegulierung #ProjectMoonshot

Encountered a problematic response from an AI model? More standards and tests are needed, say researchers

AI has a security problem — and industry insiders say testing standards have a long way to go

CNBC

Die RAND Corporation schlägt eine EU-Taskforce zur Standardisierung von KI-Evaluierungen vor. Ziel: Stärkere Qualitätskontrolle durch vier Kernanforderungen – interne/externe Validität, Reproduzierbarkeit & Portabilität. Die Initiative könnte globale Standards prägen.

👉 https://www.rand.org/pubs/perspectives/PEA3624-1.html

#KIEvaluation #KünstlicheIntelligenz #EUKI #VertrauenInKI #Standardisierung #Forschung

Die OWASP Foundation hat den AI Testing Guide (AITG) veröffentlicht: Ein Open-Source-Leitfaden für Sicherheit und Risikomanagement in KI-Systemen. Themen u.a.: nicht-deterministisches Verhalten, Data Drift und adversarielle Angriffe. Aktuell Phase 1, erste Veröffentlichung im Sept 2025.

👉 https://www.infoq.com/news/2025/06/ai-testing-guide/

#KI #KISicherheit #AITesting #Cybersicherheit #OpenSource #VertrauenInKI

OWASP Launches AI Testing Guide to Address Security, Bias, and Risk in AI Systems

The OWASP Foundation has officially introduced the AI Testing Guide (AITG), a new open-source initiative aimed at assisting organizations in the systematic testing and security of artificial intellige

InfoQ
Fehlerhafte Apple-Intelligence-Zusammenfassung wirft Fragen zur KI-Genauigkeit auf

Erfahren Sie mehr über den Apple Intelligence Fehler: Schwächen in der Textzusammenfassung werfen Fragen zur Genauigkeit der KI auf.

Apfeltalk Magazin