Мама, у меня RAG: пути к улучшению, когда он «наивный»

В последние пару лет RAG (retrieval-augmented generation) стал одной из самых обсуждаемых технологий в области обработки текстов и поисковых систем. Его идея проста: объединить поиск (retrieval) и генерацию (generation), чтобы быстрее находить нужную информацию и создавать более точные тексты. Рост объёмов данных и информационного шума привёл к тому, что классические методы поиска и генерации уже не всегда справляются с новыми задачами. Например, большие языковые модели без доступа к актуальной информации могут искажать факты, а традиционные поисковики при запросах на естественном языке дают слишком общий результат. RAG решает эти проблемы, добавляя дополнительный "слой знаний" за счёт внешних баз данных, что особенно полезно для чат-ботов, систем вопрос-ответ, рекомендательных сервисов и многих других приложений. Целью данной статьи является погружение читателя в технологию RAG, а также ознакомление с основными критериями и методами его улучшения. В этой статье мы обсудим, как именно устроен RAG, как правильно оценивать его эффективность и какие существуют техники улучшения – от уже известных методов до совершенно новых решений.

https://habr.com/ru/articles/885770/

#graph_rag #RAG #retrival_augumented_generation #llmмодели #knowledge_graph #graphrag #semantic_search #genai #ии_и_машинное_обучение

Мама, у меня RAG: пути к улучшению, когда он «наивный»

В последние пару лет RAG (retrieval-augmented generation) стал одной из самых обсуждаемых технологий в области обработки текстов и поисковых систем. Его идея проста: объединить поиск (retrieval) и...

Хабр

[Перевод] Улучшение RAG с помощью графов знаний

Генерация с дополненной выборкой (RAG) — это метод, который соединяет внешние источники данных для улучшения вывода больших языковых моделей (LLM) . Этот метод идеально подходит для LLM для доступа к частным или специфичным для предметной области данным и решения проблем, связанных с галлюцинациями . Поэтому RAG широко используется для поддержки многих приложений GenAI, таких как чат-боты AI и системы рекомендаций . Базовый RAG обычно объединяет векторную базу данных и LLM, где векторная база данных хранит и извлекает контекстную информацию для пользовательских запросов, а LLM генерирует ответы на основе извлеченного контекста. Этот подход хорошо работает во многих случаях, однако он испытывает трудности со сложными задачами, такими как многоадресное рассуждение или ответы на вопросы, требующие соединения разрозненных фрагментов информации. Например, вопрос « Какое имя было дано сыну человека, который победил узурпатора Аллектуса? »

https://habr.com/ru/articles/871700/

#GraphRAG #rag #llm #milvus #knowledge_graph

Улучшение RAG с помощью графов знаний

Знакомство с RAG и связанными с ним проблемами Генерация с дополненной выборкой (RAG) — это метод, который соединяет внешние источники данных для улучшения вывода больших языковых моделей (LLM) . Этот...

Хабр
I'm here to change the world with my app! :D Checkout it here https://apps.apple.com/de/app/memoree-ai/id1641160749
#iOS #Siri #AI #llm #knowledge_graph
‎Memoree AI

‎Memoree: Your Digital Mind Memoree helps you build your personal knowledge graph by entering any information (Memos). This can range from a simple fact, like a number, to a detailed summary of meeting outcomes. Empowered by Large Language Models (LLM), Memoree provides precise answers to your inqui…

App Store
Artificial Intelligence in Bergen, AIB
(2022) : Camille Bourgaux and Ana Ozaki and Rafael Pe{\~n}aloza
DOI: https://doi.org/10.4230/OASICS.AIB.2022.0
#__important #embedding #graph #knowledge_graph #moral_reasoning #reading_list #reasoning
#my_bibtex
DROPS - Front Matter, Table of Contents, Preface, Conference Organization