Mastodawn

[Перевод] Что такое Harness? Полный разбор на примере Claude Code, OpenAI и LangChain

Глубокий разбор того, что на самом деле строят Anthropic, OpenAI, Perplexity и LangChain. Оркестрационный цикл, инструменты, память, управление контекстом — и всё остальное, что превращает stateless LLM в работающего агента. Допустим, вы собрали чатбот. Может, даже прикрутили ReAct-цикл с несколькими инструментами. На демо работает. Но стоит попробовать сделать что-то production-grade — и всё начинает сыпаться: модель забывает, что делала три шага назад, вызовы инструментов падают без ошибок, контекстное окно забивается мусором. Проблема не в модели. Проблема во всём, что её окружает. LangChain это доказал: изменив только инфраструктуру вокруг LLM (та же модель, те же веса), они поднялись с позиции за пределами топ-30 на 5-е место в TerminalBench 2.0. В отдельном исследовательском проекте LLM оптимизировал саму инфраструктуру и достиг 76,4% pass rate, превзойдя системы, спроектированные вручную. У этой инфраструктуры теперь есть название: agent harness (агентный харнесс).

https://habr.com/ru/articles/1023316/

#agent_harness #LLM_агент #оркестрационный_цикл #ReAct_loop #context_management #Claude_Code #LangGraph #memory_management #prompt_engineering #multiagent

Что такое Harness? Полный разбор на примере Claude Code, OpenAI и LangChain

Хабр