Agents Manage Other Agents: Four Subagents Patterns in 2026

2026년 AI 에이전트 관리 패턴에 대해 4가지 주요 유형을 소개한다. 첫째, 인라인 툴 방식은 메인 에이전트가 서브에이전트를 함수 호출처럼 다루며, 동기 및 비동기 실행을 지원한다. 둘째, 팬아웃 패턴은 여러 서브에이전트를 병렬로 생성하고 결과를 일괄 수집하는 방식이다. 셋째, 에이전트 풀 패턴은 상태를 유지하는 장기 서브에이전트를 메시지로 관리하며, 다중 단계 워크플로우와 상호작용을 가능하게 한다. 각 패턴은 제어 수준과 활용 사례에 따라 장단점이 있으며, AI 에이전트 설계 및 운영에 실질적 인사이트를 제공한다.

https://www.philschmid.de/subagent-patterns-2026

#aiagents #subagents #agentpatterns #tooluse #multistepworkflow

How Agents Manage Other Agents: Four Subagents Patterns in 2026

Subagents solve context pollution, but how the main agent manages them matters more than whether they run in sync or async. Four orchestration patterns, from a simple tool call to an autonomous agent team, each with different requirements for model capability and result collection.

Stometa (@stometaverse)

벤치마크 추론 성능은 비슷해져도 도구 사용 방식과 평가 엄격성은 모델마다 다르며, 실제 프로덕션 트레이스에서는 서로 다른 목표 함수를 최적화한다고 지적합니다. 연구/평가 방식과 실제 배포 간 차이를 강조한 인사이트성 트윗입니다.

https://x.com/stometaverse/status/2052725090387972165

#llm #benchmark #tooluse #evaluation #production

Stometa (@stometaverse) on X

@OfficialLoganK agree. convergence on benchmark reasoning, divergence on tool-use surface and eval discipline. when you look at production traces, model families clearly optimize different objective functions — paper benchmarks hide this.

X (formerly Twitter)

Tool Calls en Claude: el costo que no ves venir

Cuánto cuestan realmente las tool calls en Claude API en 2026, qué es Tool Search, cómo Programmatic Tool Calling ahorra 37% de tokens y por qué explota...

https://blog.donweb.com/costos-herramientas-claude-api-tool-use/

#claudeapi #tooluse #functioncalling #anthropic #agentesia

Costos herramientas Claude API: tool use real

Cuánto cuestan realmente las tool calls en Claude API en 2026, qué es Tool Search, cómo Programmatic Tool Calling ahorra 37% de tokens y por qué explota...

Blog Donweb

How Bruce The Broken Beaked Kea Became King Of His Circus

"Bruce surprised researchers by turning his disability into such a successful advantage, both behaviorally and physiologically."

#SciComm by @GrrlScientist

#parrots #ToolUse #Behavior #cognition #Disability
https://www.forbes.com/sites/grrlscientist/2026/04/25/how-bruce-the-broken-beaked-kea-became-king-of-his-circus/

How Bruce The Broken Beaked Kea Became King Of His Circus

"Bruce surprised researchers by turning his disability into such a successful advantage, both behaviorally and physiologically."

#SciComm by @GrrlScientist

#parrots #ToolUse #Behavior #cognition #Disability
https://www.forbes.com/sites/grrlscientist/2026/04/25/how-bruce-the-broken-beaked-kea-became-king-of-his-circus/

How Bruce The Broken Beaked Kea Became King Of His Circus

"Bruce surprised researchers by turning his disability into such a successful advantage, both behaviorally and physiologically."

#SciComm by @grrlscientist

#parrots #ToolUse #Behavior #cognition #Disability
https://www.forbes.com/sites/grrlscientist/2026/04/25/how-bruce-the-broken-beaked-kea-became-king-of-his-circus/

Danny Wallace (@maestroalvarez)

5.5가 긴 툴 체인 작업에서 매우 강하다는 사용자 경험을 공유한다. VO 클라이언트와 eLearning 구축에서는 성능 향상이 뚜렷하지만, 일반적인 대화 사용자들은 체감이 적다고 한다. 고성능 사용자와 일반 사용자 간 격차가 더 커졌다는 점을 강조한다.

https://x.com/maestroalvarez/status/2047429940904149033

#ai #tooluse #productivity #llm #evaluation

Danny Wallace (@maestroalvarez) on X

@mattshumer_ This matches what I'm seeing in my apps. For my VO clients and eLearning builds, 5.5 wins on long tool chains. For casual chat users? They'll barely feel it. The gap between power users and everyone else just got wider. What's the regression you hit?

X (formerly Twitter)

0xMarioNawfal (@RoundtableSpace)

OpenAI가 GPT-5.5를 공식 출시했다는 소식입니다. 복잡한 목표 이해, 도구 사용, 작업 검증, 더 높은 완료율을 특징으로 하는 새로운 AI 모델 발표입니다.

https://x.com/RoundtableSpace/status/2047408920172380647

#openai #gpt5.5 #llm #aiagent #tooluse

0xMarioNawfal (@RoundtableSpace) on X

OPENAI JUST LAUNCHED GPT-5.5 > understands complex goals > uses tools > checks its work > carries more tasks through completion

X (formerly Twitter)

stevibe (@stevibe)

Qwen3.6 35B-A3B와 Qwen3.5 27B를 BenchLocal의 여러 벤치마크로 비교한 결과가 공유됐다. ReasonMath와 InstructFollow에서는 Qwen3.6이 경쟁력을 보였지만, ToolCall 성능은 크게 떨어져 에이전트용 도구 사용 능력에 약점이 드러났다.

https://x.com/stevibe/status/2044812786442891275

#qwen #benchmark #llm #tooluse #opensource

stevibe (@stevibe) on X

Qwen3.6 35B-A3B: smarter, but forgot how to use tools? Running 6 Bench Packs on BenchLocal across 3 open-source Qwen models. ✅ ReasonMath: 92 vs 85 vs 86 — 3.6 wins ✅ InstructFollow: 97 / 97 / 97 — tied ❌ ToolCall: 83 vs 97 vs 100 — 3.6 tanks Qwen3.5 27B still the

X (formerly Twitter)

AISatoshi (@AiXsatoshi)

Min Max 모델이 총 230B 파라미터지만 활성 파라미터는 10B뿐이라고 언급하며, 도구 사용에는 강하지만 다국어 지원은 약할 수 있다고 추정한다. 대규모 MoE 계열 모델의 특성과 활용 가능성을 짚는 트윗이다.

https://x.com/AiXsatoshi/status/2044320396837855605

#llm #moe #tooluse #multilingual #ai

AI✖️Satoshi⏩️ (@AiXsatoshi) on X

Min Maxは、230Bだけど、活性化パラメータ10Bしかないから、tool useは強いけど、多言語対応が難しいとかありそうだよね

X (formerly Twitter)