Observations on AI agent token consumption
스탠포드, 미시간, 딥마인드, 마이크로소프트 AI, MIT 연구진이 AI 에이전트의 토큰 소비를 대규모로 정량 분석한 논문을 발표했다. 에이전트 작업은 코드 채팅이나 단일 추론 작업 대비 약 1,000배 많은 토큰을 소비하며, 모델별 토큰 효율성 차이가 크고 토큰 사용량 예측이 매우 어렵다는 점을 밝혀냈다. 또한, 높은 토큰 비용이 반드시 더 나은 정확도를 보장하지 않으며, 비효율적 반복 작업이 비용 상승의 주요 원인임을 지적한다. 이 연구는 AI 비용 관리와 보안 모니터링을 위해 요청 레이어에서의 세밀한 측정과 라우팅이 필수적임을 강조한다.
https://willhackett.com/agent-token-consumption/
#aiagent #tokenconsumption #costmanagement #modelefficiency #aimonitoring
