Как научить языковую модель читать транзакции: превращаем историю платежей в базу знаний

Меня зовут Дмитрий Валов, я тимлид команды «Инструменты для банка (агенты)» в Sber AI Lab — Центре практического искусственного интеллекта Сбера. Большие языковые модели (LLM) научились отвечать на вопросы, писать код и анализировать документы. Логично спросить: «А может ли одна универсальная модель заменить зоопарк специализированных систем, которыми банк описывает своих клиентов?» Сегодня под каждую задачу — отток, кредитный риск, NBA — заводится отдельный пайплайн: свой набор фичей поверх истории транзакций, своё обучение, свои перетренировки при каждом изменении. Данные об одном и том же клиенте растаскиваются по разным системам и плохо переиспользуются. Сложнее всего — сопровождение и актуализация: стоит появиться новому источнику или фиче, как модель приходится переобучать, иначе она просто не умеет ими пользоваться. LLM выглядит идеальным кандидатом на роль единого интерфейса к этим данным: данные переводятся в текст, и новый источник достаточно дописать в промпт на инференсе, без переобучения. Но есть проблема: если просто скормить модели историю транзакций, она справляется заметно хуже специализированных моделей. В нашей работе FinTRACE мы разобрались, почему так происходит, и предложили способ это починить — не дообучая модель на огромных размеченных датасетах, а перестраивая то, что именно мы ей показываем. Статья принята на SIGIR 2026 .

https://habr.com/ru/companies/sberbank/articles/1049018/

#машинное_обучение_и_нейросети #llm #rag #retrievalaugmented_generation #транзакции #knowledge_base #антифрод #sber_ai_lab #эмбеддинги #finance

Как научить языковую модель читать транзакции: превращаем историю платежей в базу знаний

Меня зовут Дмитрий Валов, я тимлид команды «Инструменты для банка (агенты)» в Sber AI Lab — Центре практического искусственного интеллекта Сбера. Большие языковые модели (LLM) научились отвечать на...

Хабр

«Второй мозг» проекта: как ИИ пишет ТЗ по записям встреч с заказчиком

Всем привет, меня зовут Катя, я развиваю

https://habr.com/ru/companies/gram_ax/articles/1044972/

#llm_wiki #second_brain #zettelkasten #kms #knowledge_base #knowledge_management #база_знаний #второй_мозг #rag

«Второй мозг» проекта: как ИИ пишет ТЗ по записям встреч с заказчиком

Всем привет, меня зовут Катя, я развиваю Gramax . Уже несколько месяцев мы делаем ИИ-агента для работы с текстом и документацией, поэтому много смотрим на реальные кейсы в разных компаниях. Один из...

Хабр

Контекст — не инфраструктура: почему большое окно не заменяет retrieval-слой

Зачем строить RAG или retrieval-слой, если современные модели уже умеют работать с огромным контекстом?

https://habr.com/ru/articles/1042454/

#rag #retrieva #llm #база_знаний #knowledge_base #agents

Контекст — не инфраструктура: почему большое окно не заменяет retrieval-слой

Недавно в одном инженерном обсуждении я снова услышал аргумент, который в последнее время звучит всё чаще: Зачем строить RAG или retrieval-слой, если современные модели уже умеют работать с огромным...

Хабр

Почему RAG — фундамент любой AI-трансформации

За последние годы большинство AI-проектов в компаниях стартуют одинаково: сначала делают чат-бота, затем добавляют агентов, автоматизируют отдельные процессы и ожидают роста эффективности. На практике такие проекты часто не дают устойчивого результата. Модель может корректно генерировать текст, демонстрации выглядят убедительно, но в реальной работе ответы оказываются нестабильными, противоречивыми и не связанными с внутренними стандартами компании. Основная причина — отсутствие единого слоя знаний. В проекте для ресторанной группы с 10+ заведениями и историей более 15 лет мы сознательно начали не с агентов и не с интерфейсов, а с построения корпоративной RAG-инфраструктуры. Этот слой стал основой всей последующей AI-архитектуры.

https://habr.com/ru/articles/1039986/

#rag #искусственный_интеллект #llm #retrieval_augmented_generation #векторная_база_данных #embeddings #корпоративные_данные #ai_automation #knowledge_base #hallucinations

Почему RAG — фундамент любой AI-трансформации

За последние годы большинство AI-проектов в компаниях стартуют одинаково: сначала делают чат-бота, затем добавляют агентов, автоматизируют отдельные процессы и ожидают роста эффективности. На практике...

Хабр

Локальный AI в Obsidian без подписок: рабочая связка с Ollama, Gemma 4 и Infio Copilot

Я хотел собрать локального AI-ассистента для Obsidian, который умеет работать по моим заметкам без интернета и подписок. В итоге протестировал несколько подходов, остановился на связке с Obsidian + Ollama + Gemma 4 и посмотрел, насколько это вообще пригодно для повседневной работы.

https://habr.com/ru/articles/1022080/

#obsidian #ollama #gemma_4 #llm #rag #embeddings #markdown #knowledge_base #ai

Локальный AI в Obsidian без подписок: рабочая связка с Ollama, Gemma 4 и Infio Copilot

Я хотел собрать локального AI-ассистента для Obsidian, который умеет работать по моим заметкам без интернета и подписок. В итоге протестировал несколько подходов, остановился на связке с Obsidian +...

Хабр

Hybrid RAG knowledge base за 15 минут — почему пришлось собрать свою lite версию RAG и в чем опасность RAG фреймворков

Архитектура Hybrid RAG систем заняла нишу корпоративных баз знаний, став стандартом для построения сервисов генерации контента на основе внутренних корпоративных данных. Уже пару лет у этого подхода практически нет альтернатив, когда речь заходит о сочетании возможностей генеративного ИИ с требованиями корпоративной безопасности и доверия к полученным результатам. Ключевое преимущество RAG перед обычным взаимодействием с нейросетями заключается в прозрачности: мы четко видим, на основе каких документов был сформирован ответ, и можем проверить каждый шаг пайплайна Почти в каждом проекте, которые мне удалось наблюдать, происходило одно и то же - сначала команда стартует с LangChain или LlamaIndex через пару месяцев пайплайн становится неуправляемым, далее половина фреймворка выкидывается и пишется свой костомный retrieval. В итоге архитектура почти всегда выглядит одинаково - Frontend + Python backend + vector search + LLM API В этой статье я покажу почему это происходит, поделюсь сложностями с которыми можно столкнуться при реализации корпоративных баз знаний основанных на RAG технологиях, расскажу почему готовые фреймворки иногда могут быть опасны для проекта и как я пришел к созданию универсальной сборки RAG системы разворачиваемой за 15 минут За последние два года вокруг вокруг RAG систем сформировалась огромная инфраструктура. Появились специализированные фреймворки и облачные сервисы. Однако, если присмотреться к реальным запросам бизнеса, вырисовывается устойчивый паттерн. Компании хотят быстрый запуск без глубокого погружения в разработку продукта, в пару кликов загрузить корпоративные документы и получать ответы на запросы по своим внутренним документам. Компаниям не нужен очередной конструктор с бесконечными настройками, а востребована легкая, быстро разворачиваемая корпоративная RAG база знаний Основной актив, с которым должны работать такие системы это регламенты, техническая документация, договоры, инструкции и неструктурированные базы знаний. И здесь RAG действительно незаменим. Но существует и обратная сторона медали:

https://habr.com/ru/articles/1005776/

#RAG #knowledge_base #hybrid_rag #rag_система #база_знаний #it_проекты #поисковые_системы #rag_ai #ai_agent #корпоративные_решения

Hybrid RAG knowledge base за 15 минут — почему пришлось собрать свою lite версию RAG и в чем опасность RAG фреймворков

Архитектура Hybrid RAG систем заняла нишу корпоративных баз знаний, став стандартом для построения сервисов генерации контента на основе внутренних корпоративных данных. Уже пару лет у этого подхода...

Хабр

Как мы автоматизировали чанкование для RAG в Gramax: от прототипа до 95%+ точности

Недавно на Хабре вышла статья про создание RAG-системы для строительных ГОСТов. Команда Цифрового стандарта проделала титаническую работу — полгода вручную разбивали документы на смысловые чанки. Респект за настойчивость и результат. Их история вдохновила поделиться собственным опытом. Мы тоже столкнулись с проблемой чанкования для умного поиска по базе знаний. Тоже прошли через RAG, векторные базы и поиски оптимального решения. Но пошли по пути полной автоматизации. Всем привет, меня зовут Дима, я делаю ИИ-функции в

https://habr.com/ru/companies/gram_ax/articles/994782/

#rag #aiагенты #база_знаний_поиск #ииассистент #чанкинг #поисковые_технологии #knowledge_base #knowledge_management

Как мы автоматизировали чанкование для RAG в Gramax: от прототипа до 95%+ точности

Недавно на Хабре вышла статья про создание RAG-системы для строительных ГОСТов. Команда Цифрового стандарта проделала титаническую работу (полгода вручную разбивали документы на смысловые чанки)....

Хабр

Tìm kiếm nội dung video trong kiến thức số liệu: Liệu video có thể trở thành CSDL thông minh? Nhiều đội đang chuyển sang video hướng dẫn nhưng khó tìm thông tin cụ thể. Bạn có biết công cụ cho phép:
- Tìm video qua câu hỏi
- Chuyển trực tiếp đến thời điểm cần giải thích
- Tối ưu như kiến thức text?
Hỏi thực tế - cần kinh nghiệm!

#video_tim_kiem #SaaS #quản_lý_kiến_ #tech_news #video_knowledge #knowledge_base

https://www.reddit.com/r/SaaS/comments/1prkaeq/has_anyone_tried_a_knowledge_

Syllabi - Open Source AI Chatbot Platform with RAG

Build intelligent AI chatbots with RAG, native Python/R code execution, and seamless integrations. Connect to Slack, Discord, Google Drive, and more. Free and open source.

Syllabi

Тыкаю палкой XWiki что лежат в сети

В этой статье вы увидите вики, открытые для сети (намеренно или нет неважно). Заглянем в чужие вики, чтобы посмотреть как они устроены, какие у них есть фишки, и как люди упорядочивают информацию Погружаемся

https://habr.com/ru/articles/947566/

#xwiki #база_знаний #knowledgebase #knowledge_management #knowledge_base #знания_организации

Тыкаю палкой XWiki что лежат в сети

Я ударился в вики. Мне нравится складировать знание. Я получаю большое удовлетворение от возможности что моя информация кому‑то пригодится. В этой статье вы увидите вики, открытые для...

Хабр