Artificial Analysis (@ArtificialAnlys)
Artificial Analysis가 Coding Agent Index를 발표했습니다. 이 벤치마크는 에이전트 하네스와 모델 조합이 3개 주요 벤치마크에서 어떻게 성능을 내는지, 토큰 사용량과 비용까지 함께 평가해 AI 코딩 에이전트 선택에 도움을 줍니다.

Artificial Analysis (@ArtificialAnlys) on X
Announcing the Artificial Analysis Coding Agent Index! Our new coding agent benchmarks measure how combinations of agent harnesses and models perform on 3 leading benchmarks, token usage, cost and more When developers use AI to code they’re choosing a model, but also pairing it