Mastodawn

ITmedia AI＋ (@itm_aiplus)

AI의 장기적인 코드 유지보수 능력을 평가하기 위한 새로운 테스트 ‘SWE-CI’를 중국 팀이 제안했다. 실제 개발 환경에서의 지속적 코드 관리 역량을 측정하려는 평가 방법으로, AI 코딩 모델 벤치마크에 의미 있는 보완이 될 수 있다.