Hybrid RAG knowledge base за 15 минут — почему пришлось собрать свою lite версию RAG и в чем опасность RAG фреймворков

Архитектура Hybrid RAG систем заняла нишу корпоративных баз знаний, став стандартом для построения сервисов генерации контента на основе внутренних корпоративных данных. Уже пару лет у этого подхода практически нет альтернатив, когда речь заходит о сочетании возможностей генеративного ИИ с требованиями корпоративной безопасности и доверия к полученным результатам. Ключевое преимущество RAG перед обычным взаимодействием с нейросетями заключается в прозрачности: мы четко видим, на основе каких документов был сформирован ответ, и можем проверить каждый шаг пайплайна Почти в каждом проекте, которые мне удалось наблюдать, происходило одно и то же - сначала команда стартует с LangChain или LlamaIndex через пару месяцев пайплайн становится неуправляемым, далее половина фреймворка выкидывается и пишется свой костомный retrieval. В итоге архитектура почти всегда выглядит одинаково - Frontend + Python backend + vector search + LLM API В этой статье я покажу почему это происходит, поделюсь сложностями с которыми можно столкнуться при реализации корпоративных баз знаний основанных на RAG технологиях, расскажу почему готовые фреймворки иногда могут быть опасны для проекта и как я пришел к созданию универсальной сборки RAG системы разворачиваемой за 15 минут За последние два года вокруг вокруг RAG систем сформировалась огромная инфраструктура. Появились специализированные фреймворки и облачные сервисы. Однако, если присмотреться к реальным запросам бизнеса, вырисовывается устойчивый паттерн. Компании хотят быстрый запуск без глубокого погружения в разработку продукта, в пару кликов загрузить корпоративные документы и получать ответы на запросы по своим внутренним документам. Компаниям не нужен очередной конструктор с бесконечными настройками, а востребована легкая, быстро разворачиваемая корпоративная RAG база знаний Основной актив, с которым должны работать такие системы это регламенты, техническая документация, договоры, инструкции и неструктурированные базы знаний. И здесь RAG действительно незаменим. Но существует и обратная сторона медали:

https://habr.com/ru/articles/1005776/

#RAG #knowledge_base #hybrid_rag #rag_система #база_знаний #it_проекты #поисковые_системы #rag_ai #ai_agent #корпоративные_решения

Hybrid RAG knowledge base за 15 минут — почему пришлось собрать свою lite версию RAG и в чем опасность RAG фреймворков

Архитектура Hybrid RAG систем заняла нишу корпоративных баз знаний, став стандартом для построения сервисов генерации контента на основе внутренних корпоративных данных. Уже пару лет у этого подхода...

Хабр

Как мы автоматизировали чанкование для RAG в Gramax: от прототипа до 95%+ точности

Недавно на Хабре вышла статья про создание RAG-системы для строительных ГОСТов. Команда Цифрового стандарта проделала титаническую работу — полгода вручную разбивали документы на смысловые чанки. Респект за настойчивость и результат. Их история вдохновила поделиться собственным опытом. Мы тоже столкнулись с проблемой чанкования для умного поиска по базе знаний. Тоже прошли через RAG, векторные базы и поиски оптимального решения. Но пошли по пути полной автоматизации. Всем привет, меня зовут Дима, я делаю ИИ-функции в

https://habr.com/ru/companies/gram_ax/articles/994782/

#rag #aiагенты #база_знаний_поиск #ииассистент #чанкинг #поисковые_технологии #knowledge_base #knowledge_management

Как мы автоматизировали чанкование для RAG в Gramax: от прототипа до 95%+ точности

Недавно на Хабре вышла статья про создание RAG-системы для строительных ГОСТов. Команда Цифрового стандарта проделала титаническую работу (полгода вручную разбивали документы на смысловые чанки)....

Хабр

Tìm kiếm nội dung video trong kiến thức số liệu: Liệu video có thể trở thành CSDL thông minh? Nhiều đội đang chuyển sang video hướng dẫn nhưng khó tìm thông tin cụ thể. Bạn có biết công cụ cho phép:
- Tìm video qua câu hỏi
- Chuyển trực tiếp đến thời điểm cần giải thích
- Tối ưu như kiến thức text?
Hỏi thực tế - cần kinh nghiệm!

#video_tim_kiem #SaaS #quản_lý_kiến_ #tech_news #video_knowledge #knowledge_base

https://www.reddit.com/r/SaaS/comments/1prkaeq/has_anyone_tried_a_knowledge_

Syllabi - Open Source AI Chatbot Platform with RAG

Build intelligent AI chatbots with RAG, native Python/R code execution, and seamless integrations. Connect to Slack, Discord, Google Drive, and more. Free and open source.

Syllabi

Тыкаю палкой XWiki что лежат в сети

В этой статье вы увидите вики, открытые для сети (намеренно или нет неважно). Заглянем в чужие вики, чтобы посмотреть как они устроены, какие у них есть фишки, и как люди упорядочивают информацию Погружаемся

https://habr.com/ru/articles/947566/

#xwiki #база_знаний #knowledgebase #knowledge_management #knowledge_base #знания_организации

Тыкаю палкой XWiki что лежат в сети

Я ударился в вики. Мне нравится складировать знание. Я получаю большое удовлетворение от возможности что моя информация кому‑то пригодится. В этой статье вы увидите вики, открытые для...

Хабр

Поверхностный обзор источников по Obsidian

Прочитал и посмотрел почти все статьи и видео по Obsidian, которые вышли недавно (в среднем не более 1-2 ух месяцев назад). Дал каждому источнику субъективную оценку и написал короткий комментарий. Окунуться в субъективный взгляд автора

https://habr.com/ru/articles/837788/

#obsidian #projects #learning #проекты #обучение #knowledge_base #база_знаний #заметки #notetaking

Поверхностный обзор источников по Obsidian

Прочитал и посмотрел почти все статьи и видео по Obsidian, которые вышли недавно (в среднем не более 1-2 ух месяцев назад). Дал каждому источнику субъективную оценку и написал короткий комментарий....

Хабр

Кастомные иерархии в Breadcrumbs

В статье я покажу как с помощью иерархической логики и плагина Breadcrumbs можно упорядочивать базу знаний в Obsidian . Способ хоть и весьма специфический, но, я думаю, любителям Obsidian о нём будет весьма любопытно узнать. Иерархическая логика – это папки что ли?

https://habr.com/ru/articles/806339/

#obsidian #чтение #заметки #notetaking #обработка_информации #knowledge_base #breadcrumbs

Кастомные иерархии в Breadcrumbs

В статье я покажу как с помощью иерархической логики и плагина Breadcrumbs можно упорядочивать базу знаний в Obsidian . Способ хоть и весьма специфический, но, я думаю, любителям Obsidian о нём будет...

Хабр
protégé

Protégé is a free, open-source ontology editor and framework for building intelligent systems

Personal Knowledge Base Designer: Software for Expert Systems Prototyping
(2020) : Aleksandr Yu. Yurin and Nikita O. Dorodnykh
DOI: https://doi.org/10.1016/j.softx.2020.100411
#RVML #expert_system #knowledge_base #personal_knowledge_base #prototyping
#my_bibtex

База знаний сообщества DC7499 - уцелевший форк

База знаний сообщества — это [свободная](https://ru.wikipedia.org/wiki/%D0%A1%D0%B2%D0%BE%D0%B1%D0%BE%D0%B4%D0%BD%D1%8B%D0%B9_%D0%BA%D0%BE%D0%BD%D1%82%D0%B5%D0%BD%D1%82) платформа для накопления и распространения данных по практической информационной безопасности.

Техническая реализация

База знаний является вики-подобной веб-платформой, функционирующей на базе [MDwiki](http://dynalon.github.io/mdwiki/#!index.md) .
Наполнение и редактирование производится в формате облегченного языка разметки [Markdown](https://ru.wikipedia.org/wiki/Markdown).

https://github.com/ashed/kb

#defcon #dc499 #markdown #wiki #knowledge_base #information_security

Свободный контент — Википедия