We replaced RAG with a virtual filesystem for our AI documentation assistant
https://www.mintlify.com/blog/how-we-built-a-virtual-filesystem-for-our-assistant
#HackerNews #AI #Documentation #VirtualFilesystem #RAG #Innovation #TechTrends
We replaced RAG with a virtual filesystem for our AI documentation assistant
https://www.mintlify.com/blog/how-we-built-a-virtual-filesystem-for-our-assistant
#HackerNews #AI #Documentation #VirtualFilesystem #RAG #Innovation #TechTrends
Snowflake에 임베딩을 저장해서 RAG 운영하면 비용과 성능, 보안 측면에서 어떤 트레이드오프가 있을까요? 여러분은 어떤 전략으로 튜닝하시나요? #RAG #데이터엔지니어링 #Snowflake
https://aipages.net/rag-%ec%8b%a4%ec%a0%84-%ea%b5%ac%ec%b6%95-%ea%b0%80%ec%9d%b4%eb%93%9c/
Introducing #ContextAugmentedGeneration (#CAG) - an architectural refinement of #RAG for enterprise systems.
Spring Boot-based context manager adds user identity, session state & policy checks to AI workflows, boosting traceability, consistency & governance - without altering existing retrievers or LLM infrastructure.
📰 #InfoQ article by Syed Danish Ali, Technical Architect
🔗 Read now: https://bit.ly/4bOQgnv
Контролируемая эволюция RAG-системы: оценка mcp серверов и кеширование результатов запрос-ответ
Контролируемая эволюция RAG-системы: оценка mcp серверов и кеширование результатов запрос-ответ В статье рассматриваются теоритические выкладки как возможно эволюционировать RAG-систему на одном домене (документация 1С). Эволюцию можно расширить на использование нескольких доменов (финансы, бух.учет, юриспруденция, кодинг и.т.п.)
Your AI agent knows the internet. It doesn't know your company's return policy, your internal API docs, or what your team decided last Tuesday.
OpenClaw ships with a built-in knowledge skill. Drop documents in a folder, they become searchable. Answers come back with file + line citations. No vector DB to manage.
https://clawhosters.com/blog/posts/openclaw-rag-knowledge-base-tutorial
LLM — поиск товаров
LLM-поиск товаров: R&D применения технологий RAG и Knowledge Graph Search для продвинутого поиска товаров по сложным текстовым запросам. Как LLM и Knowledge Graph ищут товары
Гибридный поиск в Manticore Search
Поиск редко сводится к одному универсальному сценарию. Пользователь, вводящий "cheap running shoes", хочет точных совпадений по ключевым словам, а пользователь, задающий "comfortable footwear for jogging", выражает то же намерение другими словами. Традиционный полнотекстовый поиск хорошо справляется с первым случаем. Векторный поиск решает второй. Гибридный поиск объединяет оба в одном запросе, так что вам не приходится выбирать. В современных поисковых системах это часто описывается как комбинирование лексического (разреженного) поиска с семантическим (плотным) поиском . Разные термины, одна идея: точное совпадение плюс смысл.
https://habr.com/ru/articles/1018754/
#гибридный_поиск #полнотекстовый_поиск #векторный_поиск #full_text_search #knnsearch #vector_search #bm25 #rag
Как я свой аналог NotebookLM делал или как сделать обучение эффективнее с JuliaLM
Устав от вечных мук впн, прокси и прочих Захотев в импортозамещение решил склепать NotebookLM на свой лад доступный всем проживающим в необъятной и не только. Кто не знает, NotebookLM - это сервис который позволяет загрузить кучу исследовательских материалов и задавать им вопросы на человеческом языке. PDF-ки, статьи, ютуб-лекции — всё это превращается в базу знаний, по которой можно искать, получать саммари и даже генерировать флешкарточки для подготовки к экзаменам. Со стороны выглядит просто: закинул документ, спросил — получил ответ с цитатами. Но внутри — пайплайн из шести этапов, четыре стратегии поиска, система бюджетирования контекста и довольно нетривиальная работа с векторами. В этой статье расскажу, как всё устроено, почему выбрал именно такой стек и на какие грабли успел наступить.
Gemini Embedding 2, 텍스트·이미지·영상·오디오를 하나의 공간에 통합한 방법
Google DeepMind의 Gemini Embedding 2는 텍스트·이미지·영상·오디오·문서를 하나의 벡터 공간에 통합한 최초의 네이티브 멀티모달 임베딩 모델입니다. 멀티모달 AI 파이프라인을 단순화합니다.