Deep Research как управляемый исследовательский контур

Deep Research часто описывают как «LLM с интернет-поиском». Однако если система просто делает несколько поисковых запросов, читает часть выдачи и пишет ответ, то она упускает несколько важных аспектов, без которых невозможно полноценное исследование. В настоящем глубоком исследовании, помимо доступа к актуальным источникам, важен и сам исследовательский процесс : понять исходный вопрос, не потерять ограничения, разложить задачу на проверяемые части, собрать доказательную базу, отличить найденные факты от выводов модели, зафиксировать пробелы и собрать итоговый отчёт. В этой статье мы расскажем о том, как решили задачу построения системы B2C Deep Research на основе Instruct-модели (GigaChat Ultra 3.1), в которой модель выполняет специфицированные задачи, а логика исследования реализована с помощью конвейера из набора ролей, условий завершения, циклов поиска и постепенного накопления контекста, подкреплённого цитатами. Так Deep Research становится не просто набором промптов с доступом к источникам в интернете, а управляемым исследовательским контуром .

https://habr.com/ru/companies/sberbank/articles/1048028/

#глубокое_исследование #агентный_пайплайн #gigachat #deep_research #llm

Deep Research как управляемый исследовательский контур

Написано в соавторстве с @bear7 Deep Research часто описывают как «LLM с интернет-поиском». Однако если система просто делает несколько поисковых запросов, читает часть выдачи и пишет ответ, то она...

Хабр

GigaChat vs Opus в агентском аудите файрвола: попытка сравнения

Взяли один агент, один навык и одну выгрузку правил Ideco NGFW – и прогнали её через GigaChat Max и Claude Opus 4.8. Рассказываем, что из этого получилось, почему «настоящего» агентского теста не вышло и сколько всё это стоило в токенах и рублях. Зачем мы это затеяли В прошлой статье – «Пещера Аладдина для безопасника» – мы показывали, как автономный агент Hermes с открытой библиотекой Agent Skills разбирает IPS-логи и проводит аудит правил межсетевого экрана Ideco NGFW. Тогда мы сравнивали бесплатную фронтир-модель и платную Claude Opus и сделали осторожный вывод: для первичного triage хватает дешёвой модели, а для глубокого расследования лучше брать сильную. Тот эксперимент оставил открытым один очевидный вопрос. Все «сильные» модели в нём были западными. А что покажет российская LLM на той же задаче? Вопрос не праздный. Если вы – банк, госкомпания или объект КИИ, отправлять выгрузку правил вашего боевого файрвола в облако Anthropic – это в лучшем случае разговор с юристами, в худшем – прямое нарушение. GigaChat от Сбера работает в российском контуре, и если он справляется с аудитом конфигураций на приемлемом уровне, это меняет картину для целого класса заказчиков. Поэтому мы взяли один и тот же агент (Hermes), один и тот же навык аудита и одинаковые входные данные – и подставили под него две модели: GigaChat Max и Claude Opus 4.8 ( задумку с тестированием Claude Fable 5 для этой же задачи реализовать не удалось, со всеми нашими ИБ-скиллами он работать отказался, даже когда был доступен).

https://habr.com/ru/companies/ideco/articles/1047692/

#ngfw #Ideco #ideco_ngfw_novum #LLm #Opus #gigachat #Firewall

GigaChat vs Opus в агентском аудите файрвола: попытка сравнения

Взяли один агент, один навык и одну выгрузку правил Ideco NGFW – и прогнали её через GigaChat Max и Claude Opus 4.8. Рассказываем, что из этого получилось, почему «настоящего» агентского теста не...

Хабр

Искусственный интеллект с LangChain. Разработка ИИ-агентов на Python

Представляем новый

https://habr.com/ru/companies/bhv_publishing/articles/1047522/

#langchain #ии #llm #python #нейросети #программирование #rag #gigachat #yandexgpt #ollama

Искусственный интеллект с LangChain. Разработка ИИ-агентов на Python

Представляем новый практический курс по ИИ-агентам на Python от мастера обучающей литературы Владимира Дронова . Книга наверняка вызовет интерес у всех, кто следит за развитием больших языковых...

Хабр

Как я прикрутил GigaChat к OpenCode и что из этого понял

Мне было интересно проверить GigaChat/GigaCode не в обычном чате, а в нормальной агентной среде разработки. То есть не “ответь на вопрос”, а вот это всё: tools , function calling , streaming , MCP-инструменты , история диалога и работа внутри реального проекта. Для проверки я подключил GigaChat к OpenCode через TypeScript-плагин. Простой текстовый запрос завёлся быстро, а дальше началось самое интересное: OpenAI-like API оказался похожим на совместимый агентный протокол только снаружи. Внутри пришлось собирать отдельный слой совместимости.

https://habr.com/ru/articles/1046321/

#GigaChat #GigaCode #OpenCode #ИИагенты #агентная_разработка #function_calling #MCP #OpenAI_API #OpenAPI

Как я прикрутил GigaChat к OpenCode и что из этого понял

Это личный инженерный эксперимент. Не релиз, не продуктовая статья и не попытка кого-то убедить. Мне просто захотелось проверить руками, насколько российские модели на примере GigaChat готовы к...

Хабр

Системный промпт или галлюцинация: как я проверял AI-ассистентов и что ответили bug bounty-команды

В марте я проверял, можно ли уговорить AI-ассистентов выдать что-то похожее на системный промпт. Ответы выглядели убедительно: внутренние правила, технические “дампы”, отчёты, почти готовые кейсы для bug bounty. Но ответы команд безопасности приземлили эксперимент: часть результатов оказалась галлюцинациями, часть — обходами ограничений, а не подтверждёнными уязвимостями. Читать разбор

https://habr.com/ru/articles/1043618/

#AIассистенты #системный_промпт #галлюцинации #bug_bounty #обход_ограничений #уязвимости #информационная_безопасность #языковые_модели #Алиса #GigaChat

Системный промпт или галлюцинация: как я проверял AI-ассистентов и что ответили bug bounty-команды

В марте я попал в странный цикл: одна нейросеть помогала мне разговаривать с другой. Началось всё с простой гипотезы: можно ли заставить AI-ассистента рассказать о своих внутренних правилах,...

Хабр

ИИ‑спасатель в кармане: как мы сделали агента для помощи при ЧС, который работает без интернета

Представьте: вы в офисе, срабатывает пожарная сигнализация. Что вы делаете? Идёте к эвакуационному плану на стене? Пытаетесь вспомнить, что показывали на последнем инструктаже? Или просто идёте за толпой, надеясь, что все знают, куда бежать? Наша команда столкнулись с этим вопросом, когда начала работать над проектом для «Просоюза», профсоюзной организации «Сбера». Задача звучала просто: «Помочь людям не растеряться в чрезвычайной ситуации». Но когда мы начали погружаться в тему, оказалось, что не всё так однозначно.

https://habr.com/ru/articles/1038384/

#ииагенты #flutter #gigachat #сбер #qwen

ИИ‑спасатель в кармане: как мы сделали агента для помощи при ЧС, который работает без интернета

Предыстория Представьте: вы в офисе, срабатывает пожарная сигнализация. Что вы делаете? Идёте к эвакуационному плану на стене? Пытаетесь вспомнить, что показывали...

Хабр

Russia hopes to power its flagship GigaChat AI model with Chinese-made ​chips, #Sberbank's CEO said during President ‌Vladimir Putin's visit to China, as Western sanctions continue to block the country's access to advanced ​hardware abroad.

https://www.reuters.com/business/finance/sberbank-seeks-chinese-chips-power-russias-gigachat-ai-model-2026-05-20/

#Ukraine #Russia #China #GigaChat

От LLM к агенту: Как заставить Go приложение думать и действовать

Всё началось с доклада про AI-агентов. Заинтересовало настолько, что решил написать своего на Go. Было сложно, но получилось! Делюсь опытом: LangChainGo, инструменты, цепочки, MCP и интеграция с GigaChat.

https://habr.com/ru/articles/1033718/

#go #golang #ai #исскуственный_интеллект #gigachat #langchain #голанг

От LLM к агенту: Как заставить Go приложение думать и действовать

От автора: Эта статья родилась из желания разобраться в том, что осталось за кадром отличного доклада. 1. Введение 1.1. История создания проекта Всё началось с доклада Антона Юрченко «Улучшаем...

Хабр

Кириллица в LLM: почему русский язык в нейросетях стоит дороже и работает медленнее

Когда вы пишете запрос в ChatGPT или другую нейросеть, она не работает с буквами или словами — она режет ваш текст на маленькие кусочки. Эти кусочки называются токенами, и от того, как именно нейросеть режет текст, зависит цена ответа, скорость, и сколько информации в неё помещается за раз. С английским это работает хорошо: одно слово — обычно один‑два кусочка. С русским всё хуже: то же самое слово часто превращается в три‑четыре обрывка. Английское «contract» — один токен. Русское «разработка» — два‑три. «Программирование» — три‑четыре. Из‑за этого русский текст в облачных сервисах вроде OpenAI обходится примерно в 2 раза дороже английского, медленнее обрабатывается, и в одно «контекстное окно» нейросети помещается заметно меньше реального содержания. Эта статья — про то, откуда берётся разница, как её измерить на ваших данных и какие модели лучше работают с русским языком.

https://habr.com/ru/articles/1032610/

#llm #токенизация #нейросети #локальный_ии #selfhosted #кириллица #qwen #gigachat #llama #yandexgpt

Кириллица в LLM: почему русский язык в нейросетях стоит дороже и работает медленнее

Когда вы пишете запрос в ChatGPT или другую нейросеть, она не работает с буквами или словами — она режет ваш текст на маленькие кусочки. Эти кусочки называются...

Хабр

Open source-экосистемы — как Сбер развивает GigaChain

Мне удалось пообщаться с Константином Крестниковым @Rai220 , управляющим директором и техлидом команды GigaChain , которая занимается агентными системами и разработкой SDK для GigaChat в Сбере. Константин глубоко погружен в развитие экосистемы вокруг GigaChat, поэтому разговор получился подробным, богатым на примеры и управленческие инсайты.

https://habr.com/ru/articles/1028688/

#open_sourceэкосистемы #Сбер #GigaChain #GigaChat #GigaAgent #LangChain #опенсорс

Open source-экосистемы — как Сбер развивает GigaChain

Мне удалось пообщаться с Константином Крестниковым @Rai220 , управляющим директором и техлидом команды GigaChain , которая занимается агентными системами и разработкой SDK для GigaChat в Сбере....

Хабр