ITmedia AI+ (@itm_aiplus)

AI의 장기적인 코드 유지보수 능력을 평가하기 위한 새로운 테스트 ‘SWE-CI’를 중국 팀이 제안했다. 실제 개발 환경에서의 지속적 코드 관리 역량을 측정하려는 평가 방법으로, AI 코딩 모델 벤치마크에 의미 있는 보완이 될 수 있다.

https://x.com/itm_aiplus/status/2036640485801091527

#ai #benchmark #coding #softwareengineering #research

ITmedia AI+ (@itm_aiplus) on X

AIの“長期的なコードの保守能力”はどれほどか? 新たな評価テスト「SWE-CI」 中国チームが提案 https://t.co/N6Drd4ct8j

X (formerly Twitter)