Codex за 5 месяцев 2026: мой топ-5 релизов, что не зашло и где OpenAI обогнал Anthropic

Гоняю Codex CLI каждый день параллельно с Claude Code. За январь-май 2026 OpenAI выкатил столько релизов, что я честно сбился со счёта — GPT-5.3-Codex, GPT-5.4, GPT-5.5, Desktop app, Codex в ChatGPT mobile, Browser Use, Computer Use на macOS, стабильные hooks, plugin marketplace, /goal, Windows sandbox, Chrome extension. Это дайджест по реальному changelog с моим ранжированием — что зашло, что нет, и одна важная инверсия популярного мнения. Топ-1: GPT-5.5 — на голову выше 5.4, честно говоря, удивлён, что не назвали GPT-6. Топ-2: наблюдаемость субагентов через spawn — раньше я вручную копировал промпты, чтобы видеть, что делает дочерний агент. Теперь кликаю в карточку и вижу всё. Тотально поменяло работу команды. Что не зашло: автоматизации глючат, скорость уступает Opus 4.7, у Codex два режима запуска агентов и в каждом промпте приходится напоминать о правильном. Инверсия: лимиты у ChatGPT-плана сейчас БОЛЬШЕ, чем у Anthropic, и сбрасываются регулярно. Это контр-интуитивно, но это так. В статье: ранжированный топ-5, грабли, что я НЕ включил (потому что про это были отдельные статьи), и отсылка на архив со скиллами оркестратора в моём Telegram-канале.

https://habr.com/ru/articles/1039740/

#Codex #OpenAI #GPT55 #AIагенты #subagents #browseruse #hooks #pluginmarketplace

Codex за 5 месяцев 2026: мой топ-5 релизов, что не зашло и где OpenAI обогнал Anthropic

Раньше, чтобы видеть, что делает дочерний агент, я делал так: оркестратор писал промпт в чат, я этот промпт копировал, открывал новую сессию Codex, вставлял, запускал, ждал, копировал результат...

Хабр

browser-use CLI cho phép điều khiển trình duyệt Chrome trực tiếp từ terminal bằng CDP, thay vì dùng Playwright như agent-browser CLI. Điều này giúp browser-use nhanh hơn nhưng không hỗ trợ viết test end-to-end với Playwright. Điểm mới là CLI đi kèm thư mục SKILLS, hướng dẫn agent sử dụng trong terminal – một xu hướng thú vị cho công cụ dev. #browseruse #CLI #Chrome #DevTools #AIagent #trình_duyệt #công_cụ_lập_trình #hướng_dẫn_tự_học

https://www.reddit.com/r/programming/comments/1qkur4d/browseru

"browser-use" đã tinh chỉnh và ra mắt phiên bản xem trước của mô hình AI Qwen3-VL-30B-A3B-Instruct. Đây là một bước tiến mới trong phát triển các mô hình ngôn ngữ lớn và đa phương thức.

#AI #LLM #Qwen3VL #browseruse #ArtificialIntelligence #LargeLanguageModels #TríTuệNhânTạo #MôHìnhNgônNgữLớn

https://www.reddit.com/r/LocalLLaMA/comments/1pojfmt/browseruse_fine_tuned_qwen3vl30ba3binstruct_as/

CAPTCHA의 종말?: Claude 60% vs GPT-5 28%, 과도한 추론이 실패를 부른다

최신 AI 모델들의 CAPTCHA 풀이 능력 벤치마크. Claude 60% vs GPT-5 28%, 과도한 추론이 오히려 실패를 초래하는 역설을 분석합니다.

https://aisparkup.com/posts/6467

🎯 Supported models include #GPT-OSS-120B, #GPT-OSS-20B, #Llama4 Maverick, #Llama4 Scout, #Llama33-70B, #Llama31-8B, #KimiK2, #Qwen3-32B

🔧 Key features: deterministic inference for faster tool-using agents, cost-effective scaling, approved tool use with clear allowlists, seamless migration capability

📋 Ready-to-use cookbook tutorials with #BrowserBase #MCP, #BrowserUse #MCP, #Exa #MCP, #Firecrawl #MCP, #HuggingFace #MCP, #Parallel #MCP, #Stripe #MCP, #Tavily #MCP

Browser Use, the tool making it easier for AI 'agents' to navigate websites, raises $17M | TechCrunch

Browser Use, the 'agentic' framework used by Manus, among other platforms, has raised $17 million from investors including Paul Graham.

TechCrunch

"#Manus, the viral AI #agentplatform from Chinese startup #ButterflyEffect, has had an unintended side effect: raising the profile of another #AItool called #BrowserUse.
Browser Use, which aims to make websites more accessible for agentic applications that perform tasks on a user’s behalf, has experienced explosive growth in the past week. Daily downloads more than quintupled from around 5,000 on March 3 to 28,000 on March 10, co-creator Gregor Zunic told TechCrunch.@

https://techcrunch.com/2025/03/12/browser-use-one-of-the-tools-powering-manus-is-also-going-viral/

Browser Use, one of the tools powering Manus, is also going viral | TechCrunch

The virality of AI 'agent' platform Manus from Chinese startup Butterfly Effect has benefitted another tool: Browser Use.

TechCrunch

Browser Use: KI-Tool definiert Web-Interaktion neu & Manus AI antreibt

Entwickelt in Zürich
Ermöglicht KI-Agenten Web-Interaktionen
Treibt Erfolg von Manus AI voran

Jetzt lesen und folgen!

#ai #ki #artificialintelligence #kuenstlicheintelligenz #BrowserUse #ManusAI

https://kinews24.de/browser-use-und-manus-ai-hype/

Browser Use: Das KI-Tool, das Web-Interaktion 2925 neu definiert

Browser Use und Manus AI-Hype! Erfahren Sie, wie dieses KI-Tool Webseiten für Agenten zugänglich macht und die Zukunft des Internets prägt.

KINEWS24.de
Launch HN: Browser Use (YC W25) – open-source web agents — https://github.com/browser-use/browser-use
#HackerNews #LaunchHN #BrowserUse #OpenSource #WebAgents #YC #W25
GitHub - browser-use/browser-use: 🌐 Make websites accessible for AI agents. Automate tasks online with ease.

🌐 Make websites accessible for AI agents. Automate tasks online with ease. - browser-use/browser-use

GitHub

Заменяем хабраюзеров ИИ-агентами. Гайд по browser-use

TLDR: видео с результатом в конце статьи Библиотека browser-use невероятно стрельнула практически в день релиза, на текущий момент это около 16 тысяч звезд на Гитхабе, и сотни восторженных отзывов на Reddit, в Твиттере, и так далее. Команду, создавшую browser-use даже приняли в YC . У неё революционная точность по сравнению с другими "ИИ агентами использующий браузер" (89% против Runner H с 67%). Я очень удивился, что на Хабре всё ещё нет статьи с описание того, что это, и как это использовать. Сегодня мы это исправим: мы сделаем ИИ, который будет читать статьи на Хабре, и писать комментарии о том, почему продукт описанный в статье никому не нужен. Добро пожаловать в мир ИИ-агентов!

https://habr.com/ru/articles/875798/

#искусственный_интеллект #агент #ииагент #browseruse

Заменяем хабраюзеров ИИ-агентами. Гайд по browser-use

TLDR; видео с результатом в конце статьи Библиотека browser-use невероятно стрельнула практически в день релиза, на текущий момент это около 16 тысяч звезд на Гитхабе, и сотни восторженных отзывов на...

Хабр