Mastodawn

I just want an agent. Часть 2. Как мы построили виртуальную команду для разработки ИИ-агентов

В первой части я рассказывал про мета-агента — свой прототип системы, которая собирает ботов по описанию на естественном языке, и про то, как этот проект занял первое место на внутреннем конкурсе. Напомню концепцию: пользователь говорит «хочу бота» и отгружает требования, а агент проектирует архитектуру и отдает готовый JSON. Но конкурсный прототип и продакшен-система — это разные вещи. Чтобы реализовать такой функционал для корпоративных пользователей и тем более продавать, нужно сделать так, чтобы наш ИИ-агент для производства ИИ-агентов работал надежно, не один раз, не только на демокейсах и, самое главное, не вытворял что-нибудь неожиданное посреди рабочего процесса. Это значит, что нам нужна инженерная система — с ролями, инструментами, ограничителями и накопленным опытом. Вторая часть моего лонгрида как раз посвящена тому, как мы реализовали продакшен-решение для создания ИИ-агентов, которое впоследствии стало главным вайб-код-инструментом нашей платформы MWS AI Agents Platform и получило название «ИИ-команда» (AI Force). Велком под кат

https://habr.com/ru/companies/ru_mts/articles/1038988/

#ИИагент #метаагент #lowcode #nocode #LLM #промптинжиниринг #MCP #мультиагентная_система #ChainofThought #вайбкодинг

I just want an agent. Часть 2. Как мы построили виртуальную команду для разработки ИИ-агентов

В первой части я рассказывал про мета-агента (Meta Agent) — свой прототип системы, которая собирает ботов по описанию на естественном языке, и про то, как этот проект занял первое место на внутреннем...

Хабр

Habr May 25

I just want an agent. Часть 1. Как я научил ИИ собирать ИИ-агентов за пользователей и выиграл конкурс

Привет, Хабр! Меня зовут Данила Катальшов, я технический лидер команды промпт-инженеров MWS AI. В конце прошлого года мы (в значении MWS AI) выпустили собственную платформу для сборки ИИ-агентов — MWS AI Agents Platform. Платформа избавляет от необходимости разбираться в программировании — можно собирать нужного бота, ИИ-агента или мультиагентную систему, просто перетаскивая блоки в визуальном конструкторе. Однако для работы на ней все равно нужно было инженерное мышление, по меньшей мере на уровне понимания циклов создания ИИ-решений, типов данных, связей между различными компонентами и прочее. Чтобы закрыть этот общий гэп low-code-платформ, в рамках внутреннего корпоративного конкурса я собрал мета-агента (Meta Agent) — систему, где ИИ-агент выступает архитектором и собирает других агентов по текстовому описанию. В итоге проект занял первое место и, что более важно, потом мы с командой запилили уже полноценный аналогичный (ну почти) функционал для нашей MWS AI Agents Platform, который выкатили вот буквально на днях. В этой части лонгрида речь пойдет о моем конкурсном проекте. А во второй — уже будет история о том, как реализован аналогичный вайб-код-функционал на платформе. Поехали!

https://habr.com/ru/companies/mts_ai/articles/1038936/

#ИИагент #метаагент #lowcode #nocode #LLM #промптинжиниринг #MCP #мультиагентная_система #ChainofThought #вайбкодинг

I just want an agent. Часть 1. Как я научил ИИ собирать ИИ-агентов за пользователей и выиграл конкурс

Хабр

Habr May 23

Reasoning-модели сломали мой промпт-инжиниринг. Год переучиваюсь

Вторник, час ночи. Закидываю в GPT-5.5 свой проверенный шаблон с развёрнутым CoT, тремя few-shot, ролью «опытный аналитик». Получаю мусор. Удаляю весь промпт, пишу из трёх строк — работает. Минут десять пялюсь в монитор. Половина моего трёхлетнего арсенала против reasoning-моделей либо лишняя, либо вредит. Что сдохло, что наоборот выросло в значимости, что писать под какую задачу. Без эмоциональной role-play и многословных «подумай шаг за шагом» — они сейчас только тормозят.

https://habr.com/ru/articles/1038510/

#промптинжиниринг #reasoningмодели #gpt55 #claude_opus #llm #chainofthought #fewshot #aiагенты

Reasoning-модели сломали мой промпт-инжиниринг. Год переучиваюсь

Вторник, час ночи. Сижу пишу промпт чтобы вытащить из 40 PDF-ок с актами нужные поля в JSON. Задача рутинная, у меня под неё лежит проверенный шаблон. Развёрнутый CoT, три few-shot примера, роль...

Хабр

Habr May 13

Промпт-инжиниринг 2026: что устарело с приходом reasoning-моделей

Половина моих промпт-техник за пару лет работы с GPT-4 и Claude 3.5 на reasoning-моделях работает хуже минимального промпта. Развёрнутый chain-of-thought, многошаговый few-shot, эмоциональная role-play — лишнее или вредит. А скучные техники — контракт результата, системные промпты, constraints — наоборот, стали критически важными. Что умерло, что выжило, что подходит под какую задачу.

https://habr.com/ru/articles/1034572/

#промптинжиниринг #reasoningмодели #gpt55 #claude_opus #llm #chainofthought

Промпт-инжиниринг 2026: что устарело с приходом reasoning-моделей

Полгода назад взял старый промпт. Тот самый, отлаженный за два года — с развёрнутым chain-of-thought, тремя few-shot примерами, ролью «опытного инженера с 15 лет опыта», пошаговой схемой рассуждения....

Хабр

Habr Apr 6

Иллюзия логики: как я доказал, что LLM-агенты игнорируют факты, и почему Chain-of-Thought делает только хуже

Сейчас каждый второй стартап пилит ИИ-агентов. Мы оборачиваем LLM в цикл Промпт -> Вызов инструмента -> Ответ и ждем, что нейросеть сама расследует инцидент, найдет баг или напишет фичу. Но на практике автономные агенты часто ходят по кругу, игнорируют явные ошибки и «влюбляются» в свою первую догадку. Индустрия пытается лечить это костылями: наращивает контекст до миллионов токенов или заставляет модель «подумать шаг за шагом» (Chain-of-Thought). Я решил проверить эту архитектуру на прочность. Собрал локальный измерительный стенд LOCK-R, вооружился Теоремой Байеса и поймал современные LLM за руку. В этой статье я математически докажу, почему одиночные агенты структурно уязвимы, как токены размышлений заставляют их врать самим себе еще искуснее, и почему паттерн «Слепого Судьи» - это единственный способ вылечить AI от предвзятости. Тестируем на локальной Qwen-9B и фронтирной GPT-5.4.

https://habr.com/ru/articles/1020016/

#llm #ai_agents #rag #machine_learning #архитектура #chainofthought #теорема_байеса #gpt54 #qwen35 #бенчмарк

Иллюзия логики: как я доказал, что LLM-агенты игнорируют факты, и почему Chain-of-Thought делает только хуже

Сейчас каждый второй стартап пилит ИИ-агентов. Мы оборачиваем LLM в цикл Промпт -> Вызов инструмента (API/Поиск) -> Чтение -> Ответ и ждем, что нейросеть сама расследует инцидент, найдет баг...

Хабр

DrBob, 🧠 Mechanic Mar 24

Chain-of-Thought (CoT) Prompting

Chain-of-Thought (CoT) prompting is a technique where asking questions, rather than issuing direct instructions activates a model’s full internal reasoning pathway.

The key insight from the original framing is that instructions skip steps 1–3, jumping straight to synthesis, while questions force the model to work through the entire reasoning chain.

https://neurodoctor.com/2026/03/20/chain-of-thought-cot-prompting/

#chainofthought #cot #ai #llm #prompt #prompts #prompting #claude #chatgpt #gemini #ericschmidt

AI Daily Post Mar 13

New research shows TensorRT Edge‑LLM can run chain‑of‑thought reasoning directly on devices, boosting physical AI tasks like autonomous‑vehicle perception and MATH500 benchmarks. Efficient, on‑device inference means smarter, safer robots without cloud latency. Dive into the details of this breakthrough for on‑device language models. #TensorRT #EdgeLLM #ChainOfThought #PhysicalAI

🔗 https://aidailypost.com/news/tensorrt-edgellm-enables-efficient-chainofthought-processing-physical

Andreas Becker Mar 6

Chain of Thought bleibt sichtbar.

Aktuelle Reasoning-Modelle können ihre internen Rechenschritte nicht vor Monitoring-Systemen verbergen. Studien zeigen, dass Versuche zur Verschleierung – etwa durch Keyword-Vermeidung – meist fehlschlagen. Besonders bei langen Rechenketten bricht die Kontrolle über die eigene Ausgabe zusammen. Die Analyse der Zwischenschritte bleibt damit ein valider Weg für Sicherheitschecks.

#OpenAI #KISicherheit #ChainOfThought
https://www.all-ai.de/news/beitrage2026/openai-studie-neu-luegen

Moderne KI-Systeme können ihre echten Absichten nicht verschleiern

Die internen Denkprozesse von Reasoning-Modellen bleiben für Sicherheitsmechanismen lesbar. Manipulationsversuche schlagen derzeit meistens fehl.

All-AI.de

tech news ᳇ eicker.news Feb 8

#EricJang argues that #AImodels can now genuinely think and code. Using #ClaudeCode, he demonstrates #automatedresearch workflows, traces reasoning’s evolution from #ChainofThought to #DeepSeekR1, and predicts massive demand for inference compute. #Codingagents will fundamentally transform #softwareengineering, #research, and #militarystrategy - “the rocks can think now.“ https://evjang.com/2026/02/04/rocks.html?eicker.news #tech #media #news

As Rocks May Think

You are viewing the mobile version of this page. This content is best viewed on a desktop.

Eric Jang

AI Daily Post Feb 8

New research shows DeepSeek-R1 and QwQ-3 develop distinct personalities that boost chain-of-thought reasoning, hinting at a future where societies of thought among LLMs improve problem solving. Open-source enthusiasts, see how personality diversity reshapes AI reasoning! #DeepSeekR1 #QwQ32B #ChainOfThought #PersonalityDiversity

🔗 https://aidailypost.com/news/deepseekr1-qwq3-exhibit-competing-personalities-that-improve-reasoning