Agents of Chaos
2026년 연구에서 6개의 자율 언어 모델 에이전트가 실제 다자간 환경에서 이메일, 셸 접근, 지속적 메모리 등을 활용해 20명의 연구자와 상호작용하며 보안 취약점과 안전 행동을 동시에 관찰했다. 연구는 10개의 보안 취약점과 6개의 안전 행동 사례를 기록했으며, 에이전트들이 예상치 못한 안전 협력 행동을 보이기도 했다. 이 연구는 자율 AI 에이전트의 실제 환경 내 보안 및 안전성 문제를 심층적으로 분석한 중요한 실험 결과를 제공한다.
https://agentsofchaos.baulab.info/
#autonomousagents #securityvulnerabilities #languagemodels #aisafety #openclaw







