[Long-running Agents by Addy Osmani

이 글은 며칠에서 몇 주에 걸쳐 지속적으로 일하는 '롱러닝(long-running) AI 에이전트'의 부상을 정리하며, 핵심 경쟁력은 모델 자체보다 상태 저장, 세션 복원, 평가 분리, 샌드박스 실행, 메모리 관리 등을 담당하는 하네스(harness) 설계에 있다고 설명합니다. 앤트로픽, 커서, 구글 등 주요 플레이어의 접근이 비슷한 구조로 수렴하고 있으며, 앞으로는 다수의 장기 실행 에이전트를 안전하게 운영하고 검증하는 운영 체계가 중요해질 것이라고 전망합니다.

https://news.hada.io/topic?id=29255

#longrunningagents #aiengineering #agentharness #memorybank #enterpriseai

Long-running Agents by Addy Osmani | GeekNews

오래 가는 AI 에이전트 — 채팅창을 넘어선 다음 단계의 엔지니어링기존의 AI 에이전트는 한 번의 대화창 안에서 도구를 호출하고 결과를 받는 구조였습니다. 이 방식은 컨텍스트 윈도우가 가득 차거나 모델이 스스로 “완료”를 선언하는 순간 한계에 부딪히곤 했습니다. Addy Osmani는 이 글에서 시간 단위가 아니라 며칠, 몇 주에 걸쳐 작업을 이어가는 ‘롱

GeekNews
Effective harnesses for long-running agents

Anthropic is an AI safety and research company that's working to build reliable, interpretable, and steerable AI systems.