Claude Opus 4.5: как Anthropic сделала флагманскую модель в 3 раза дешевле и при этом умнее

24 ноября Anthropic выпустила Claude Opus 4.5 — и это не просто очередной апдейт. Модель стала в 3 раза дешевле ($5 vs $15 за 1M токенов), но при этом обогнала конкурентов по ключевым метрикам. Что изменилось: 80.9% на SWE-bench — лучший результат среди всех LLM для кода Работает автономно 30+ минут без вашего участия Экономия токенов до 76% через новый параметр effort В 4.6 раза устойчивее к prompt injection, чем GPT-5.1 Реальная экономика: Команда из 10 разработчиков экономит $4800-6000 в год только на стоимости API. GitHub Copilot после интеграции Opus 4.5 сократил расход токенов вдвое. В статье разбираем: → Детальные бенчмарки vs GPT-4 и Gemini → 5 практических кейсов с кодом (code review, генерация тестов, security audit) → Архитектуру AI-агентов на базе Opus 4.5 → Реальные цифры ROI и окупаемости → Ограничения, о которых молчит маркетинг Бонус: примеры интеграции в CI/CD, стратегия использования параметра effort и конфиги для мониторинга. Если вы используете LLM в production или только планируете внедрение — эта статья сэкономит вам недели экспериментов.

https://habr.com/ru/articles/974086/

#Claude #Anthropic #LLM #AI #code_generation #API #GPT4 #нейросети #code_review #автоматизация

Claude Opus 4.5: как Anthropic сделала флагманскую модель в 3 раза дешевле и при этом умнее

24 ноября 2025 года Anthropic выстрелила релизом Claude Opus 4.5 — модели, которая переписывает правила игры для всех, кто использует LLM в production. Главная фишка? Цена упала в 3 раза, а качество...

Хабр

How I Learned to Stop Worrying and Love the… BDSM

Это публикация-опрос. Поэтому и такой заголовок :) Отсылку поймут не только лишь все, но главная цель - привлечь внимание народа к опросу. В принципе, публикацию можно даже и не читать. Она просто поясняет, откуда взялись два варианта между которыми нужно выбирать по итогу - какое из двух названий лучше применить в технической документации. Буду благодарен всем, кто поучаствует в голосовании.

https://habr.com/ru/articles/944134/

#code_generation #llm #codex #вайбкодинг #опрос #мнение_народа

How I Learned to Stop Worrying and Love the… BDSM

За последние пару лет LLM прочно вошли в мою (и не только мою) жизнь. Как говорится: " Мы не знаем что это такое, если бы мы знали что это такое, но мы не знаем что это такое! ". Я взял для заголовка...

Хабр

Как мы обучали модели для кода GigaCode

Привет, Хабр! Меня зовут Дмитрий Бабаев, я руководитель R&D GigaCode в Сбере. Сегодня расскажу о том, как мы создавали ИИ-помощника для программистов задолго до того, как это стало мейнстримом. Многие компании думают о том, чтобы выпустить собственного ИИ-помощника для разработчиков. Мы начали делать GigaCode около трех лет назад — ещё до появления Cursor и других популярных сегодня решений. За это время мы создали целую экосистему решений для разработки – GigaDEV: IDE на основе IntelliJ, платформу Gitverse как аналог GitHub и сам GigaCode.

https://habr.com/ru/companies/sberbank/articles/935356/

#llm #code_assistant #machine_learning #code_generation

Как мы обучали модели для кода GigaCode

Привет, Хабр Меня зовут Дмитрий Бабаев, я руководитель R&D GigaCode в Сбере. Сегодня расскажу о том, как мы создавали ИИ‑помощника для программистов задолго до того,...

Хабр

Инженерное лидерство в эпоху AI: почему 72% продуктивности теряется и как с этим бороться

Парадокс века: исследование METR с участием 16 опытных разработчиков показало, что AI-инструменты увеличили время выполнения задач на 19% , хотя сами разработчики были уверены, что экономят 20% времени. Если вы тимлид или менеджер, внедряющий AI в команде — эта статья сэкономит вам месяцы экспериментов и поможет избежать типичных граблей, на которые наступили 80% компаний в 2025 году.

https://habr.com/ru/articles/935188/

#ai #управление_разработкой #метрики_продуктивности #code_review #code_generation #mlops #team_management

Инженерное лидерство в эпоху AI: почему 72% продуктивности теряется и как с этим бороться

Меня зовут Александр Майорский, я руковожу разработкой в VK и последние время занимаюсь внедрением AI в процессы разработки. Когда полгода назад мы начали внедрять AI в процессы разработки, я был...

Хабр

AI-бот для QA-инженеров: как я сделал Telegram-ассистента для ежедневной прокачки

Привет! Меня зовут Евгений. Я — Full-Stack QA Engineer в Devscribed и сегодня хочу поделиться своим экспериментом — QA Mentor Bot . Это Telegram‑бот, который отправляет в телеграмм группу случайные вопросы по тестированию и сразу же генерирует на них развёрнутые ответы с помощью AI. В этой статье я расскажу, как устроен проект и с какими «подводными камнями» столкнулся в процессе разработки.

https://habr.com/ru/articles/927708/

#telegrambot #deepseek #ai #vibecoding #code_generation #testing #education #education_projects #задачи_для_тестировщика #собеседование_вопросы

AI-бот для QA-инженеров: как я сделал Telegram-ассистента для ежедневной прокачки

Что, если бы кто-то 4 раза в день напоминал тебе важное из мира QA — с примерами, объяснениями и без воды? Я сделал такого помощника. Привет! Меня зовут Евгений. Я — Full-Stack QA Engineer в...

Хабр

AI-first backend: опыт реального вайб-кодинг проекта

В 2025 году вопрос полноценной генерации продуктового кода с помощью LLM («вайб-кодинг») становится все более актуальным, но при этом остается и достаточно дискуссионным: насколько такие подходы вообще применимы в реальных проектах, действительно ли они сокращают время и стоимость разработки, и что происходит с тестируемостью и поддержкой такого кода в долгосрочной перспективе? Сложность этого вопроса не только в качестве самой генерации, но и в том, как интегрировать LLM в инженерные процессы, чтобы получить управляемый, масштабируемый и архитектурно устойчивый код. Моя мотивация была проста: попробовать выстроить полноценный продуктовый backend для нетривиального телеграм-бота с функциями агента (планированием, напоминаниями, памятью и проактивным поведением, возможностью дальнейшей расширяемости и интеграции сторонних сервисов), при этом — не писать руками ни строчки кода. Чтобы человек участвовал только как архитектор и асессор, а все проектирование и реализация шли через промпты в специализированные IDE (Cursor, Copilot, Zed) и LLM (как доступные через API, так и в «пользовательской» продуктовой обвязке).

https://habr.com/ru/articles/926238/

#vibecoding #telegrambot #cursor_ai #claudeopus4 #gpt4 #code_generation

AI-first backend: опыт реального вайб-кодинг проекта

1. Введение и мотивация В 2025 году вопрос полноценной генерации продуктового кода с помощью LLM («вайб-кодинг») становится все более актуальным, но при этом остается и достаточно дискуссионным:...

Хабр

C#, Кодогенерация и DDD. Часть 2 — Получаем данные и пробуем генерировать

Это - вторая публикация в серии DDD и кодогенерация. ( первая часть ) В этой части мы научимся получать данные через рефлексию и Roslyn в одинаковой форме. А атрибуты из Roslyn - как объекты.

https://habr.com/ru/articles/921552/

#c# #c#net #roslyn #domaindriven_design #code_generation

C#, Кодогенерация и DDD. Часть 2 — Получаем данные и пробуем генерировать

Это - вторая публикация в серии DDD и кодогенерация. ( первая часть ) В этой части мы научимся получать данные через рефлексию и Roslyn в одинаковой форме. Даже типизированные атрибуты как var...

Хабр

Метапрограммирование 2.0: макросы и генерация кода в современном мире

Забудьте про скучные «Hello, World». Макросы и шаблоны давно стали полноценными инструментами архитектора кода: от хитрых C++-шаблонов до процедурных макросов Rust и Java-аннотаций, автоматически генерирующих целые фреймворки. В этой статье мы рассмотрим примеры, где metaprogramming избавляет от рутины и экономит часы работы над проектом. Детали как всегда под катом.

https://habr.com/ru/companies/ruvds/articles/916552/

#ruvds_статьи #метапрограммирование #генерация_кода #макросы #code_generation #Rust #Java #C++ #metaprogramming #шаблонный_код

Метапрограммирование 2.0: макросы и генерация кода в современном мире

Забудьте про скучные «Hello, World». Макросы и шаблоны давно стали полноценными инструментами архитектора кода: от хитрых C++-шаблонов до процедурных макросов Rust и Java-аннотаций, автоматически...

Хабр

Метапрограммирование 2.0: макросы и генерация кода в современном мире

Забудьте про скучные «Hello, World». Макросы и шаблоны давно стали полноценными инструментами архитектора кода: от хитрых C++-шаблонов до процедурных макросов Rust и Java-аннотаций, автоматически генерирующих целые фреймворки. В этой статье мы рассмотрим примеры, где metaprogramming избавляет от рутины и экономит часы работы над проектом. Детали как всегда под катом.

https://habr.com/ru/companies/ruvds/articles/916552/

#ruvds_статьи #метапрограммирование #генерация_кода #макросы #code_generation #Rust #Java #C++ #metaprogramming #шаблонный_код

Метапрограммирование 2.0: макросы и генерация кода в современном мире

Забудьте про скучные «Hello, World». Макросы и шаблоны давно стали полноценными инструментами архитектора кода: от хитрых C++-шаблонов до процедурных макросов Rust и Java-аннотаций, автоматически...

Хабр

[Перевод] Чем отличается мой Type Predicate Generator?

Кратко: это максимально безопасный по типизации инструмент, генерирует статические файлы с кодом для максимальной совместимости, быстрый благодаря предварительной компиляции (AOT) и компактный. Также он предоставляет удобный генератор модульных тестов, чтобы можно было быть почти на 100% уверенным, что создаваемые предикаты работают, как ожидается. Этот пост предлагает детальное сравнение Generator с другими инструментами для проверки типов во время выполнения, а также дает более широкий обзор смежных тем. Со временем пост постепенно превращается в более аналитическую статью, а не просто "мой X круче, чем ваш Y". Погрузиться

https://habr.com/ru/articles/876514/

#type_safety #code_generation #jit

Чем отличается мой Type Predicate Generator?

Кратко: это максимально безопасный по типизации инструмент, генерирует статические файлы с кодом для максимальной совместимости, быстрый благодаря предварительной компиляции (AOT) и компактный. Также...

Хабр