How we built a virtual filesystem for our Assistant

We replaced expensive sandboxes with ChromaFs, a virtual filesystem over Chroma, to give our docs AI assistant the ability to explore documentation like a developer would.

Mintlify

Snowflake에 임베딩을 저장해서 RAG 운영하면 비용과 성능, 보안 측면에서 어떤 트레이드오프가 있을까요? 여러분은 어떤 전략으로 튜닝하시나요? #RAG #데이터엔지니어링 #Snowflake

https://aipages.net/rag-%ec%8b%a4%ec%a0%84-%ea%b5%ac%ec%b6%95-%ea%b0%80%ec%9d%b4%eb%93%9c/

RAG 실전 구축 가이드 - 인공지능 인사이트

Snowflake에 임베딩을 저장·검색해 RAG(검색 기반 생성) 시스템을 안정적으로 운영하는 실무 가이드. 비용·성능 비교, 단계별 SQL/코드, 도입 체크리스트을 한 번에 정리.

인공지능 인사이트

Introducing #ContextAugmentedGeneration (#CAG) - an architectural refinement of #RAG for enterprise systems.

Spring Boot-based context manager adds user identity, session state & policy checks to AI workflows, boosting traceability, consistency & governance - without altering existing retrievers or LLM infrastructure.

📰 #InfoQ article by Syed Danish Ali, Technical Architect

🔗 Read now: https://bit.ly/4bOQgnv

#Java #SpringBoot #LLMs #Microservices

Контролируемая эволюция RAG-системы: оценка mcp серверов и кеширование результатов запрос-ответ

Контролируемая эволюция RAG-системы: оценка mcp серверов и кеширование результатов запрос-ответ В статье рассматриваются теоритические выкладки как возможно эволюционировать RAG-систему на одном домене (документация 1С). Эволюцию можно расширить на использование нескольких доменов (финансы, бух.учет, юриспруденция, кодинг и.т.п.)

https://habr.com/ru/articles/1019018/

#rag #1c #ai

Контролируемая эволюция RAG-системы: оценка mcp серверов и кеширование результатов запрос-ответ

В статье рассматриваются теоретические выкладки как возможно эволюционировать RAG-систему на одном домене (документация 1С). Эволюцию можно расширить на использование нескольких доменов (финансы,...

Хабр

Your AI agent knows the internet. It doesn't know your company's return policy, your internal API docs, or what your team decided last Tuesday.

OpenClaw ships with a built-in knowledge skill. Drop documents in a folder, they become searchable. Answers come back with file + line citations. No vector DB to manage.

https://clawhosters.com/blog/posts/openclaw-rag-knowledge-base-tutorial

#OpenClaw #RAG #AIAgents #SelfHosted

RAG Tutorial: OpenClaw Knowledge Base Setup | ClawHosters

Set up RAG in OpenClaw to search your own documents with source citations. Step-by-step knowledge base config for product docs, FAQs, and meeting notes.

ClawHosters

LLM — поиск товаров

LLM-поиск товаров: R&D применения технологий RAG и Knowledge Graph Search для продвинутого поиска товаров по сложным текстовым запросам. Как LLM и Knowledge Graph ищут товары

https://habr.com/ru/articles/1018860/

#LLM #RAG #Knowledge_Graph #ML #GraphRAG #Graph_Search

LLM — поиск товаров

Всем привет! В данной статье хочу поделится результатам R&D о применении  LLM и графов в поиске товаров по текстовому запросу юзера. Данная идея появилась при разработке Retrivier модуля RAG...

Хабр

Гибридный поиск в Manticore Search

Поиск редко сводится к одному универсальному сценарию. Пользователь, вводящий "cheap running shoes", хочет точных совпадений по ключевым словам, а пользователь, задающий "comfortable footwear for jogging", выражает то же намерение другими словами. Традиционный полнотекстовый поиск хорошо справляется с первым случаем. Векторный поиск решает второй. Гибридный поиск объединяет оба в одном запросе, так что вам не приходится выбирать. В современных поисковых системах это часто описывается как комбинирование лексического (разреженного) поиска с семантическим (плотным) поиском . Разные термины, одна идея: точное совпадение плюс смысл.

https://habr.com/ru/articles/1018754/

#гибридный_поиск #полнотекстовый_поиск #векторный_поиск #full_text_search #knnsearch #vector_search #bm25 #rag

Гибридный поиск в Manticore Search

Поиск редко сводится к одному универсальному сценарию. Пользователь, вводящий "cheap running shoes", хочет точных совпадений по ключевым словам, а пользователь, задающий "comfortable footwear for...

Хабр

Как я свой аналог NotebookLM делал или как сделать обучение эффективнее с JuliaLM

Устав от вечных мук впн, прокси и прочих Захотев в импортозамещение решил склепать NotebookLM на свой лад доступный всем проживающим в необъятной и не только. Кто не знает, NotebookLM - это сервис который позволяет загрузить кучу исследовательских материалов и задавать им вопросы на человеческом языке. PDF-ки, статьи, ютуб-лекции — всё это превращается в базу знаний, по которой можно искать, получать саммари и даже генерировать флешкарточки для подготовки к экзаменам. Со стороны выглядит просто: закинул документ, спросил — получил ответ с цитатами. Но внутри — пайплайн из шести этапов, четыре стратегии поиска, система бюджетирования контекста и довольно нетривиальная работа с векторами. В этой статье расскажу, как всё устроено, почему выбрал именно такой стек и на какие грабли успел наступить.

https://habr.com/ru/articles/1018702/

#NotebookLM #RAG #rag_ai #JuliaLM #AI

Как я свой аналог NotebookLM делал или как сделать обучение эффективнее с JuliaLM

Устав от вечных мук впн, прокси и прочих Захотев в импортозамещение решил склепать NotebookLM на свой лад доступный всем проживающим в необъятной и не только. Кто не знает, это сервис который...

Хабр

Gemini Embedding 2, 텍스트·이미지·영상·오디오를 하나의 공간에 통합한 방법

Google DeepMind의 Gemini Embedding 2는 텍스트·이미지·영상·오디오·문서를 하나의 벡터 공간에 통합한 최초의 네이티브 멀티모달 임베딩 모델입니다. 멀티모달 AI 파이프라인을 단순화합니다.

https://aisparkup.com/posts/10098