At a recent infosec gathering, someone described a real incident: an AI agent couldn't complete its goal due to permissions. So it found another agent on Slack with the right access and asked nicely. The other agent complied.
That's social engineering. Nobody told the agent to do that. The mission just needed to continue.
I posted an article today about what happens when we give agents goals but forget to tell them when to stop.

https://www.securityeconomist.com/never-say-die/

#agentic_ai #openclaw #airisk

Never Say Die: How We Will Pay When Agentic AI Learns to Survive

Every agent needs a mission. The problem is what happens when the mission means the agent needs to survive.

The Security Economist

I use AGENTS.md (https://agents.md) to define AI agent work discipline:

- be honest, don't aim to please
- work in small, verifiable batches
- write checkpoints
- when and how to commit
- how to document work
- decision-making hygiene
- core principles of the solution
- etc.

I then use agent skills (https://agentskills.io/) to add details and best practices.

What do you use to keep your AI agent on track?

#ai #coding #it #programming #development #agentic_ai #dev #generativeAI

AGENTS.md

AGENTS.md is a simple, open format for guiding coding agents. Think of it as a README for agents.

Цена контекста в агентной разработке: почему bottleneck — не код, а внимание человека

Пока diff небольшой, в нас просыпается хранитель инженерной чистоты: мы спорим о нейминге, замечаем лишний пробел, обсуждаем, стоило ли выносить логику в helper , но когда правка разрастается до тысяч строк, строгость уступает другому подходу: CI зелёный, тесты прошли, код выглядит вроде неплохо - можно жать Approve . С coding-агентами проблема становится более системной. Пока задача небольшая и хорошо ограничена, результат ещё можно напрямую соотнести с исходным запросом, но при асинхронной и мультиагентной работе у каждого из агентов появляются собственные подзадачи, гипотезы и хвосты незавершённых решений. Поэтому, возвращаясь в процесс, человек проверяет уже не изолированные изменения, а заново восстанавливает состояние задачи - что именно было задумано, что уже проверено, какие инварианты теперь считаются действующими и где остался риск. И именно здесь ломается наивный human-in-the-loop , а большой diff - является лишь симптомом. Настоящее узкое место - стоимость повторного входа в контекст: формально человек остаётся в процессе, но фактически его роль всё чаще сводится к механическому одобрению, в свою очередь дефицитом становится не машинная производительность, а человеческое внимание. В прошлой статье о контекстной инженерии для coding-агентов я писал о памяти агента. Здесь - о том, какая память и какие механизмы контроля нужны уже человеку.

https://habr.com/ru/articles/1008344/

#мультиагентная_разработка #ИИагенты #agentic_AI #code_review #context_switching #humanintheloop #quality_gates #контекстная_инженерия #AIassisted_development

Цена контекста в агентной разработке: почему bottleneck — не код, а внимание человека

Пока diff небольшой, в нас просыпается хранитель инженерной чистоты: мы спорим о нейминге, замечаем лишний пробел, обсуждаем, стоило ли выносить логику в helper , но когда правка разрастается до тысяч...

Хабр

Что можно понять только написав своего агента для кодинга

Сейчас агентов пишут все. Ваш сосед пишет агента. Ваш кот, вероятно, тоже, просто пока не пушит на GitHub. И если вы ещё не начали, то как минимум думали об этом в душе, прикидывая архитектуру между шампунем и кондиционером. Чем интересен именно кодинг-агент? Это идеальная ловушка для самоуверенного разработчика. Цель кристально ясна : читай код, пойми его, измени, проверь. Что может пойти не так? (Спойлер: вообще всё.) Под этой обманчивой простотой скрывается хаос — модели, которые обходят ваши ограничения с грацией уличного кота, инструменты, ломающиеся способами, о которых вы не подозревали, и промпты, которые прекрасно работают ровно до момента обновления модели на одну минорную версию. Я построил такого агента, тут расскажу что я узнал — и, надеюсь, этого хватит, чтобы вы захотели повторить мой путь. Или хотя бы посочувствовать. Что я собственно построил Назвал я его QuillCode . Звучит солидно, а внутри — вот что:

https://habr.com/ru/articles/1007720/

#agentic_coding #agentic_ai #agentic_engineering #software_engineering #software_development #claude_code

Что можно понять только написав своего агента для кодинга

Сейчас агентов пишут все. Ваш сосед пишет агента. Ваш кот, вероятно, тоже, просто пока не пушит на GitHub. И если вы ещё не начали, то как минимум думали об этом в душе, прикидывая архитектуру между...

Хабр

Почему Perplexity Computer — один из самых главных релизов в мире AI

Perplexity тихо выпустила Perplexity Computer — и есть ощущение, что рынок пока не до конца осознал масштаб этого шага. На поверхности это выглядит как ещё один режим внутри знакомого интерфейса. Но по сути — это заявка на новый уровень агентных систем. В этой статье разберём, что именно представляет собой Perplexity Computer, какие возможности он открывает уже сейчас, чем отличается от OpenClaw и почему этот релиз может оказаться стратегически важным для всего рынка AI‑агентов.

https://habr.com/ru/companies/first/articles/1003788/

#perplexity #openclaw #ai #llm #chatgpt #cloude #agent #agentic_ai #perplexity_ai

Почему Perplexity Computer — важный релиз в мире AI

Perplexity тихо выпустила Perplexity Computer — и есть ощущение, что мы пока не до конца осознали масштаб этого шага. На поверхности это выглядит как ещё один режим внутри знакомого интерфейса. Но по...

Хабр

I am onto a new small Java project. I have some specific classes, methods and algorithmic ideas in mind.

And I would like to give it a try with "vibe coding" to see how this works, how good it works and to know what everyone is talking about.

Are there any half-useful free coding agents? Should I write a short description, push it to github and tell their thing to do its thing?

Pointers?

#vibecoding #java #agentic_ai #claude #copilot

Как я запилил Skill для $mol, чтобы Claude Code перестал писать на React

Привет, Хабр! Последние несколько месяцев я пишу на фреймворке $mol . $mol очень крутая штука, но для иишки слишком мало информации в датасетах. Агент постоянно что то да путал, и даже не смотря на типизацию в моле ( даже в css ) это всё очень долго кругами ходило. Агент:

https://habr.com/ru/articles/1002192/

#mol #$mol #skills #skill #agent #agentic_ai #agentic_coding #agent_skills

Как я запилил Skill для $mol, чтобы Claude Code перестал писать на React

Привет, Хабр! Последние несколько месяцев я пишу на фреймворке $mol . $mol очень крутая штука, но для иишки слишком мало информации в датасетах. Поставить скил: npx skills add b-on-g/mol_skill -y -g...

Хабр
Explaining Agentic AI: The Good, the Bad & the Ugly

YouTube

Пять AI‑трендов от Google или мы все будем «пастухами» нейросетей. Разбор Report 2026 и мой опыт

Пару месяцев назад вышла статья от Google про тренды 2026 ИИ агентов В их новом отчете «AI Agent Trends 2026» слово «LLM» отходит на второй план. Главный герой теперь — Agentic AI (Агентный ИИ). Я изучил 50 страниц этого отчета, чтобы вам не пришлось, если кратко то Спойлер: Google считает, что эпоха «чат‑ботов» закончилась . Начинается эпоха «цифровых конвейеров», где люди не пишут код или тексты, а дирижируют ансамблем ИИ‑агентов. Ниже — разбор 5 главных трендов, анализ нового протокола MCP и мой личный опыт попытки создать такого «оркестратора» в пет‑проекте (спойлер: это сложнее, чем кажется).

https://habr.com/ru/articles/996464/

#AIагенты #Agentic_AI #Google_Cloud #A2A_protocol #MCP #агентские_системы #цифровая_трансформация #AI_в_бизнесе #LLM #продактменеджмент

Пять AI‑трендов от Google или мы все будем «пастухами» нейросетей. Разбор Report 2026 и мой опыт

Пару месяцев назад вышла статья от Google про тренды 2026 ИИ агентов LINK TO REPORT В их новом отчете «AI Agent Trends 2026» слово "LLM" отходит на второй план. Главный герой теперь - Agentic AI...

Хабр
Didero consigue 30 millones de dólares para poner las adquisiciones de fabricación en piloto inconsciente "agentic" – ButterWord

Didero functions as an agentic AI layer that sits on top of a company’s existing ERP, acting as a coordinator that reads incoming communications and automatically executes the necessary updates and tasks.

ButterWord