10 актуальных RAG-подходов: какие реально полезны и когда их применять?

Всем привет, на фоне обновлений в LLM-стеке за последний год, решил собрать практический список RAG-подходов, которые реально используются в продакшене на основе моего опыта и того что я изучал в других кейсах.

https://habr.com/ru/articles/1029616/

#aiразработка #rag_ai #rag_pipeline #retrieval_augmented_generation #llm #llmмодели #vector_search #hybrid_search #graphrag #multimodal

10 актуальных RAG-подходов: какие реально полезны и когда их применять?

Всем привет, на фоне обновлений в LLM-стеке за последний год, решил собрать практический список RAG-подходов, которые реально используются в продакшене на основе моего опыта и того что я изучал в...

Хабр

MCP-Manticore: Позвольте вашему AI-ассистенту писать запросы к Manticore за вас

Вы слышали, что Manticore Search быстрый. Вы слышали, что он объединяет полнотекстовый, векторный и нечеткий поиск в одном движке. Но когда вы начинаете реально работать с ним, вы сидите перед документацией, угадываете синтаксис SQL и надеетесь, что CREATE TABLE не выдаст непонятную ошибку. MCP-Manticore меняет правила игры. Это сервер Model Context Protocol (MCP), который подключает Cursor, Claude Code, Codex CLI или любой другой MCP-совместимый AI-ассистент напрямую к вашему экземпляру Manticore. AI может:

https://habr.com/ru/articles/1015284/

#mcp #model_context_protocol #ai #llm #ai_assistant #search_engine #data_base #sql #vector_search #full_text_search

MCP-Manticore: Позвольте вашему AI-ассистенту писать запросы к Manticore за вас

Введение Вы слышали, что Manticore Search быстрый. Вы слышали, что он объединяет полнотекстовый, векторный и нечеткий поиск в одном движке. Но когда вы начинаете реально работать с ним, вы сидите...

Хабр

Гибридный поиск в Manticore Search

Поиск редко сводится к одному универсальному сценарию. Пользователь, вводящий "cheap running shoes", хочет точных совпадений по ключевым словам, а пользователь, задающий "comfortable footwear for jogging", выражает то же намерение другими словами. Традиционный полнотекстовый поиск хорошо справляется с первым случаем. Векторный поиск решает второй. Гибридный поиск объединяет оба в одном запросе, так что вам не приходится выбирать. В современных поисковых системах это часто описывается как комбинирование лексического (разреженного) поиска с семантическим (плотным) поиском . Разные термины, одна идея: точное совпадение плюс смысл.

https://habr.com/ru/articles/1018754/

#гибридный_поиск #полнотекстовый_поиск #векторный_поиск #full_text_search #knnsearch #vector_search #bm25 #rag

Гибридный поиск в Manticore Search

Поиск редко сводится к одному универсальному сценарию. Пользователь, вводящий "cheap running shoes", хочет точных совпадений по ключевым словам, а пользователь, задающий "comfortable footwear for...

Хабр

Разработка агентов в AI Studio Yandex Cloud

Сегодня обсудим развёртывание агентов, созданных в Yandex Cloud AI Studio Agent Atelier . Atelier — это такой очевидный UI для настройки PromptTemplate для Responses API .

https://habr.com/ru/companies/reksoft/articles/1016026/

#yandexcloud #ai_studio #agent_atelier #atelier #ии_агент #yaml #vector_search

Разработка агентов в AI Studio Yandex Cloud

Сегодня обсудим развёртывание агентов, созданных в Yandex Cloud AI Studio Agent Atelier . Atelier — это такой очевидный UI для настройки PromptTemplate для Responses API . Создание агента в Agent...

Хабр
Vector Data in .NET - Building Blocks for AI Part 2 - .NET Blog

Explore the power of Vector Data in .NET AI for enhancing semantic searches and intelligent applications.

.NET Blog
Check-before-Suggest(幻覚対策 — Hallucination) - Qiita

はじめに この記事では、RAG(Retrieval-Augmented Generation)システムにおいて、LLMがトピックを提案する際に発生する幻覚(hallucination)を低減するためのシンプルかつ効果的なパターン「Check-before-Suggest」...

Qiita

Как мы учили поиск понимать контекст: практическое руководство Купера для маркетплейсов

В IT-сообществе только и разговоров об эмбеддингах, metric learning, косинусных расстояниях и семантическом поиске. На конференциях все хвастаются красивыми слайдами про нейросети и векторные пространства. Но если заглянуть под капот и посмотреть, что реально работает в поиске крупных маркетплейсов и e-commerce платформ, то там, как правило, он — добрый, старый полнотекстовый индекс. Почему? Потому что полнотекстовый поиск — это стабильно, быстро и понятно. Минус только один, его уже недостаточно. Да, он классно ловит точные совпадения, но синонимы, переформулировки и небольшие ошибки прощает пользователям уже с большим трудом. Меня зовут Игорь Самарин , я Machine Learning Engineer из команды поиска в Купере, где уже полтора года занимаюсь проектами, связанными с векторами. В этой статье я расскажу, как на самом деле работает поиск внутри компании, поведаю о полнотекстовом поиске — его сильных сторонах и недостатках. Затем объясню специфику векторного поиска и разберу, какие именно проблемы старого подхода он решает и продемонстрирую, как обучить векторную модель на своих данных, чтобы она понимала специфику каталога. А в конце вас ждут реальные результаты из A/B тестов и небольшой панч о перспективах.

https://habr.com/ru/companies/kuper/articles/976068/

#ml #машинное_обучение #vector_search #векторный_поиск #гибридный_поиск #векторная_модель #elasticsearch

Как мы учили поиск понимать контекст: практическое руководство Купера для маркетплейсов

Когда слов недостаточно, поможет семантический поиск на Elasticsearch В IT-сообществе только и разговоров об эмбеддингах, metric learning, косинусных расстояниях и семантическом поиске. На...

Хабр

[Перевод] Автоэмбеддинги: поиск на ИИ без лишней мороки

Мы рады представить новую возможность, которая делает создание приложений с семантическим поиском таким же простым, как написание SQL-запроса: Автоэмбеддинги . Теперь Manticore Search берёт на себя генерацию эмбеддингов — без дополнительных пайплайнов, внешних сервисов и лишней мороки.

https://habr.com/ru/articles/947632/

#векторный_поиск #семантический_поиск #эмбеддинги #embeddings #vector_search #semantic_search #sql_search #knnsearch #hnsw #json_api

Автоэмбеддинги: поиск на ИИ без лишней мороки

Мы рады представить новую функцию, которая делает создание приложений с семантическим поиском таким же простым, как написание SQL-запроса: Автоэмбеддинги . С этой возможностью Manticore Search берёт...

Хабр
Introducing the AI Dev Gallery: Your Gateway to Local AI Development with .NET - .NET Blog

Discover the new AI Dev Gallery, a Windows application that provides interactive local AI samples, easy model downloads, and source code export - all built with .NET AI building blocks.

.NET Blog
Qdrant Summer of Code 24 - Qdrant

Introducing Qdrant Summer of Code 2024 program. GSoC alternative.