Observations on AI agent token consumption

스탠포드, 미시간, 딥마인드, 마이크로소프트 AI, MIT 연구진이 AI 에이전트의 토큰 소비를 대규모로 정량 분석한 논문을 발표했다. 에이전트 작업은 코드 채팅이나 단일 추론 작업 대비 약 1,000배 많은 토큰을 소비하며, 모델별 토큰 효율성 차이가 크고 토큰 사용량 예측이 매우 어렵다는 점을 밝혀냈다. 또한, 높은 토큰 비용이 반드시 더 나은 정확도를 보장하지 않으며, 비효율적 반복 작업이 비용 상승의 주요 원인임을 지적한다. 이 연구는 AI 비용 관리와 보안 모니터링을 위해 요청 레이어에서의 세밀한 측정과 라우팅이 필수적임을 강조한다.

https://willhackett.com/agent-token-consumption/

#aiagent #tokenconsumption #costmanagement #modelefficiency #aimonitoring

Observations on AI agent token consumption | Will Hackett

A new paper from Stanford, Michigan, DeepMind and All Hands is the first open empirical study of how AI agents actually spend tokens at scale. The findings line up closely with what we are seeing at Flowstate, from a different angle.