Mastodawn

Если пропустили Claude последние 3 месяца: топ-5 фич с юзкейсами и история про $400K в Bitcoin

За последние три месяца у Anthropic вышло много, но большая часть — не там, где кричат. Subagents существуют год, skills — с октября 2025, MCP — больше полутора лет. Делать вид, что это новинки квартала, — нечестно. А вот реально новое: Agent Teams (5 февраля 2026), Claude Cowork в GA на Mac и Windows (9 апреля), Opus 4.7 с командой /effort и режимом /fast (поздний апрель), Plugin Marketplace с auto-update и --plugin-url, Agent View (12 мая). Я гоняю это всё на своих проектах и собрал честный топ-5 — что меняет workflow, что разочаровало, и одна анти-новинка, которая выжгла лимиты всей моей команде за один день в марте. Внутри: разбор каждой фичи через юзкейсы, виральная история про парня, который через Claude нашёл пароль от Bitcoin-кошелька на $400K, и контр-тезис, почему /effort на extra-high делает работу часто лучше Agent Teams в 3 раза дешевле.

https://habr.com/ru/articles/1038006/

#Claude #claude_code #Claude_Cowork #Agent_Teams #LLM #Opus_47 #developertools #AIагенты

Если пропустили Claude последние 3 месяца: топ-5 фич с юзкейсами и история про $400K в Bitcoin

Февраль–май 2026 — один из самых плотных кварталов у Anthropic за последний год. И большая часть того, что обсуждают в Twitter-X под тегом #ClaudeCode, — это вообще не новинки квартала. Subagents в...

Хабр

Habr May 15

Новый бенчмарк по кодингу для LLM ProgramBench: 9 топ моделей, 200 задач, 248 тысяч тестов. Полностью решённых — ноль

200 задач. 248 тысяч тестов. Девять моделей, среди них всё свежее: Opus 4.7, GPT 5.4, Gemini 3.1 Pro, Sonnet 4.6. На SWE-bench те же модели берут 70 % и выше. На ProgramBench — ноль полного резолва. Лучший «почти решено» у Opus 4.7 — 3 %. У остальных и того нет. Это новый бенчмарк от Meta Superintelligence Labs, Stanford и Harvard (2026). Агенту дают скомпилированный бинарь и описание программы. Никаких сорсов, никакой декомпиляции, никакого интернета. Задача — собрать программу с нуля так, чтобы она прошла 248 тысяч поведенческих тестов. Это не «пофиксить баг в существующем коде» (как SWE-bench) и не «дописать функцию по сигнатуре» (как HumanEval). Это другой ТИП задачи: спроектировать систему. Внутри — методология, паттерн результатов (что модели вытягивают, а что нет), и почему этот ноль — на самом деле важная новость для тех, кто строит на LLM продакшен.

https://habr.com/ru/articles/1035574/

#ProgramBench #бенчмарк #LLM #кодингагенты #SWEbench #vibecoding #opus_47 #GPT54

Новый бенчмарк по кодингу для LLM ProgramBench: 9 топ моделей, 200 задач, 248 тысяч тестов. Полностью решённых — ноль

200 задач. 248 тысяч поведенческих тестов. Девять моделей, среди них всё свежее на 2026 год: Opus 4.7, GPT 5.4, Gemini 3.1 Pro, Sonnet 4.6, Haiku 4.5. На SWE-bench те же модели стабильно берут 70 % и...

Хабр

Habr May 12

1 миллион токенов в Opus 4.7 — маркетинг. Реально полезных — 300 тысяч. И сами Anthropic это подтверждают

В начале мая Кангвук Ли (CAIO Krafton) опубликовал в X разбор: двумя API-вызовами и 35 1M токенов контекста в Claude Opus 4.7 — это «доступно», а не «полезно». В system card §8.7.2 сами Anthropic пишут: на 1M MRCR упал с 78.3% (Opus 4.6) до 32.2% (Opus 4.7), и для long-context retrieval они рекомендуют держать 4.6 как fallback. Деградирует и 4.6 — просто в два раза медленнее. Параллельно Кангвук Ли двумя API-вызовами и 35 строками Python вытащил из Codex AES-зашифрованный compaction-промпт. Сравнил с открытым compact_20260112 от Anthropic. Они близнецы. Реальная разница не в промпте, а в том, где живёт компакция. GPT-5.1-Codex-Max — первая модель, нативно обученная компакции на уровне весов. Anthropic пока через сервер-сайд хук. Это и объясняет, почему по ощущениям Codex держит длинные сессии лучше. Внутри: verbatim промпты обеих систем рядом, side-by-side таблица, разбор системной карты Opus 4.7 и практические выводы для Claude Code и Codex CLI.

https://habr.com/ru/articles/1034214/

#LLM #Codex #Claude_Code #Opus_47 #GPT51CodexMax #contextcompaction #promptinjection #AIагенты

1 миллион токенов в Opus 4.7 — маркетинг. Реально полезных — 300 тысяч. И сами Anthropic это подтверждают

В начале мая Кангвук Ли (CAIO Krafton) опубликовал в X разбор: двумя API-вызовами и 35 строками Python он вытащил из Codex AES-зашифрованный compaction-blob и реконструировал серверный промпт сжатия...

Хабр

Habr May 7

Code with Claude 2026: что Anthropic показали разработчикам на своей конференции

6 мая 2026 года в Сан-Франциско прошла вторая конференция Anthropic для разработчиков — Code with Claude. Площадку для мероприятия в этот раз расширили: в этот раз взяли бывший автосалон SVN West, так как спрос оказался выше. Следующие 2 конференции пройдут в Лондоне и Токио (19 мая и 10 июня), а записи всех докладов должны опубликовать в ближайшее время на YouTube канале Claude Code . Для тех, кто хочет посмотреть все доклады уже сейчас, опубликовал полную запись в ТГК (5+ часов видео). Ниже пройдемся по всем докладам и отметим самое важное.

https://habr.com/ru/articles/1032588/

#Anthropic #Claude_Code #managed_agents #routines #multiagent_orchestration #dreaming #outcomes #GitHub_Copilot #prompt_caching #Opus_47

Code with Claude 2026: что Anthropic показали разработчикам на своей конференции

Хабр

Habr Apr 29

Я просил Claude перестать мне льстить. 16 апреля получил. Беру свои слова назад

16 апреля Anthropic выкатила Claude Opus 4.7. На бенчмарках 12 побед из 14, цена та же. Через 24 часа Reddit называл его legendarily bad. И вот в чём фокус: месяц назад я сам ныл, что Claude слишком поддакивает. Anthropic исправила. Получилась спор-машина. Беру свои слова назад.

https://habr.com/ru/articles/1029796/

#Claude #Opus_47 #Anthropic #AI_coding #sycophancy #бенчмарки #разработка #LLM

Я просил Claude перестать мне льстить. 16 апреля получил. Беру свои слова назад

16 апреля Anthropic выкатила Claude Opus 4.7. На self-reported бенчмарках - 12 побед из 14. SWE-bench Verified +6.8, MCP-Atlas +14.6, SWE-bench Pro +10.9. Цена та же, 25 за миллион токенов. Через 24...

Хабр

Habr Apr 29

Что в Opus 4.7 устроили с токенизацией?

Если подать один и тот же текст в Opus 4.7 и Opus 4.6, в новой модели он может оказаться представлен гораздо большим числом токенов. А тогда он и обходится дороже, и занимает больше места в контекстном окне. Получается «скрытая инфляция»: цены и лимиты указаны прежние, но на практике расходы могут возрасти. Как именно всё изменилось и почему? В каких случаях число токенов вырастет максимально, а в каких останется прежним? Это хочется понимать не только из-за Opus: подобное ведь может произойти и с другой моделью. Но полных официальных ответов нет. Поэтому мы и собрали доступную информацию, и самостоятельно проверили через API, что происходит с разными типами текстов. Мы делаем редактор кода с поддержкой разных ИИ-моделей, так что нам важно, как эта разница может сказаться на наших пользователях. Ну, и конечно, нам самим любопытно разобраться, что происходит в индустрии.

https://habr.com/ru/companies/kodik/articles/1028700/

#opus_47 #токенизация

Что в Opus 4.7 устроили с токенизацией?

Если подать один и тот же текст в Opus 4.6 и Opus 4.7, в новой модели он может оказаться представлен гораздо большим числом токенов. А тогда он и обходится дороже, и занимает больше места в...

Хабр

Habr Apr 28

10 настроек Claude Code, до которых большинство разработчиков не доходит

Ранее я писал про утечку исходного кода Claude Code . 512 000 строк, KAIROS, упоминания нерелизнутых моделей Opus 4.7 и Sonnet 4.8. Так вот. В актуальном Claude Code уже есть Opus 4.7 . Ровно как и было в leaked-коде. Вместе с ней появился новый уровень /effort xhigh - это мы сегодня тоже разберём. В первой части я показал что Claude Code умеет из коробки. Типовой сценарий после этого: "понял, установил, пользуюсь". И дальше тот же потолок что у всех - Claude работает быстро, но как-то странно. Отвечает не то, повторяет одно и то же к концу сессии, просит разрешения на каждый чих, жрёт токены как не в себя. Это решается настройками. Конкретными. Которые лежат в двух файлах и никто до них не доходит. Ниже десять вещей которые я настроил за полгода работы с Claude Code и которые сделали разницу между "работает" и "работает как отдел". С готовыми конфигами. Копируй, вставляй, меняй под себя.

https://habr.com/ru/articles/1028988/

#claude_code #anthropic #opus_47 #ai_agents #ai_coding #developer_tools #prompt_engineering #hooks #claudemd #vibecoding

10 настроек Claude Code, до которых большинство разработчиков не доходит

Хабр

Habr Apr 23

Что я вынес из AMA с инженером Anthropic: 12 инсайтов про Claude Code, которые нигде не написаны

20 000 заявок, тобрали меньше 2%. Я оказался в числе участников хакатона Anthropic, где инженеры компании в живом AMA рассказывали то, что не попадает в документацию. Skills вместо агентов. Opus 4.7, который читает ваши инструкции настолько буквально, что ломает привычные workflow. Memory-слой поверх встроенного. Verification-паттерны для продакшена. И ещё 8 конкретных приёмов, которые я проверил на своих проектах. Без воды, без “10 промптов для продуктивности”. Только то, что реально меняет работу с Claude Code.

https://habr.com/ru/articles/1026814/

#Claude_Code #Anthropic #AIассистент #vibe_coding #skills #Opus_47 #CLAUDEmd #промптинженерия #разработка_с_ИИ #Claude

Что я вынес из AMA с инженером Anthropic: 12 инсайтов про Claude Code, которые нигде не написаны

Прямо сейчас идет Built with Opus 4.7: a Claude Code hackathon . Было более 20 тысяч заявок, отбор прошли менее 2% и я стал одним из тех, кому посчастливилось попробовать свои силы и получить API...

Хабр

Habr Apr 18

Opus 4.7, Codex управляет ПК, TTS от Google, бренд кроссовок «переобулся» в ИИ-компанию

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий. Неделя вышла плотной: Anthropic выкатила Opus 4.7 и Claude Design, OpenAI прокачала Codex до компьютерного агента. Открытые TTS от Google и генератор картинок от Baidu. Бренд кроссовок теперь ИИ-компания, а ИИ-кавер «Седой ночи» от Канье топ-2 Shazam. Всё самое важное — в одном месте. Поехали! Читать дайджест →

https://habr.com/ru/companies/timeweb/articles/1025062/

#нейродайджест #нейросети #ии #новости #opus_47 #claude_design #tts #codex #anthropic #timeweb_дайджест

Opus 4.7, Codex управляет ПК, TTS от Google, бренд кроссовок «переобулся» в ИИ-компанию

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий. Меня зовут Вандер , и каждую неделю я обозреваю новости о...

Хабр