rtk + context-mode поверх Serena + Semble: стоит ли нахлобучивать прокси-экономию токенов или это бред?

Тема экономии токенов сейчас дико популярна, и мы с ребятами в Гильдии AI-инженеров знатно её пообсуждали. Напомню краткую суть: там связка Serena (LSP) + Semble (векторные эмбеддинги) + Ripgrep (поиск координат) показала себя абсолютным топом для точечной навигации. Но в комментариях и личке мне тут же начали советовать: «Нахлобучь сверху еще rtk для сжатия вывода терминала и context-mode для полнотекстового индекса репозитория! Тема прокси-экономии сейчас на пике хайпа, сэкономишь еще больше!». Я подумал за**ись. И решил провести душный чек. Взял популярный open-source проект supermemory (~180 файлов, JS/TS) и замерил: действительно ли добавление rtk + context-mode дает реальный профит поверх моего текущего сетапа, или это просто карго-культ и оверхед, который утянет бюджет в минус?

https://habr.com/ru/articles/1043774/

#codex_cli #codex #claude_code #gemini #antigravity #serena #mcp #agent_skills #agent_hooks #agent_harness

rtk + context-mode поверх Serena + Semble: стоит ли нахлобучивать прокси-экономию токенов или это бред?

Смешивать или не смешивать? Здравствуй, искушенный читатель. Недавно я выкатил на Хабре статью про сравнение 21 подхода к сбору контекста для ИИ-агентов ( habr.com/ru/articles/1042880/ ). Тема...

Хабр

[Перевод] Что такое Harness? Полный разбор на примере Claude Code, OpenAI и LangChain

Глубокий разбор того, что на самом деле строят Anthropic, OpenAI, Perplexity и LangChain. Оркестрационный цикл, инструменты, память, управление контекстом — и всё остальное, что превращает stateless LLM в работающего агента. Допустим, вы собрали чатбот. Может, даже прикрутили ReAct-цикл с несколькими инструментами. На демо работает. Но стоит попробовать сделать что-то production-grade — и всё начинает сыпаться: модель забывает, что делала три шага назад, вызовы инструментов падают без ошибок, контекстное окно забивается мусором. Проблема не в модели. Проблема во всём, что её окружает. LangChain это доказал: изменив только инфраструктуру вокруг LLM (та же модель, те же веса), они поднялись с позиции за пределами топ-30 на 5-е место в TerminalBench 2.0. В отдельном исследовательском проекте LLM оптимизировал саму инфраструктуру и достиг 76,4% pass rate, превзойдя системы, спроектированные вручную. У этой инфраструктуры теперь есть название: agent harness (агентный харнесс).

https://habr.com/ru/articles/1023316/

#agent_harness #LLM_агент #оркестрационный_цикл #ReAct_loop #context_management #Claude_Code #LangGraph #memory_management #prompt_engineering #multiagent

Что такое Harness? Полный разбор на примере Claude Code, OpenAI и LangChain

Глубокий разбор того, что на самом деле строят Anthropic, OpenAI, Perplexity и LangChain. Оркестрационный цикл, инструменты, память, управление контекстом — и всё остальное, что превращает stateless...

Хабр

[Перевод] Ваш харнес, ваша память

Agent harness'ы стали основным способом построения агентов, и это надолго. Они неразрывно связаны с памятью агента. Если вы используете закрытый харнес — особенно за проприетарным API — вы добровольно передаёте контроль над памятью своего агента третьей стороне. Память критически важна для создания хороших и удобных агентных систем, а значит, это создаёт колоссальную привязку к платформе. Память — а вместе с ней и харнесы — должны быть открытыми, чтобы вы владели своими данными.

https://habr.com/ru/articles/1023156/

#agent_harness #агентная_память #LLM_агенты #vendor_lockin #open_source_агенты #context_engineering #stateful_агенты #Claude_Code #LangChain #modelagnostic

Ваш харнес, ваша память

Agent harness'ы стали основным способом построения агентов, и это надолго. Они неразрывно связаны с памятью агента. Если вы используете закрытый харнес — особенно за проприетарным API — вы добровольно...

Хабр