Beyond Semantic Similarity

본 논문은 기존의 고정된 의미 유사도 기반 검색 방식을 넘어, 에이전트가 직접 원시 코퍼스에 일반 터미널 도구를 활용해 상호작용하는 직접 코퍼스 인터랙션(DCI) 방식을 제안한다. DCI는 임베딩 모델이나 벡터 인덱스 없이도 다단계 추론과 복합 조건 검색에 유연하게 대응하며, 기존 희소 및 밀집 검색 기법 대비 여러 벤치마크에서 우수한 성능을 보였다. 이는 에이전트 검색에서 단순한 추론 능력뿐 아니라 코퍼스와의 인터페이스 해상도가 검색 품질에 중요한 영향을 미친다는 점을 시사한다. AI 에이전트 구축과 검색 시스템 설계에 새로운 인터페이스 설계 방향을 제시한다.

https://arxiv.org/abs/2605.05242

#informationretrieval #agenticsearch #directcorpusinteraction #semanticsearch #llm

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

Modern retrieval systems, whether lexical or semantic, expose a corpus through a fixed similarity interface that compresses access into a single top-k retrieval step before reasoning. This abstraction is efficient, but for agentic search, it becomes a bottleneck: exact lexical constraints, sparse clue conjunctions, local context checks, and multi-step hypothesis refinement are difficult to implement by calling a conventional off-the-shelf retriever, and evidence filtered out early cannot be recovered by stronger downstream reasoning. Agentic tasks further exacerbate this limitation because they require agents to orchestrate multiple steps, including discovering intermediate entities, combining weak clues, and revising the plan after observing partial evidence. To tackle the limitation, we study direct corpus interaction (DCI), where an agent searches the raw corpus directly with general-purpose terminal tools (e.g., grep, file reads, shell commands, lightweight scripts), without any embedding model, vector index, or retrieval API. This approach requires no offline indexing and adapts naturally to evolving local corpora. Across IR benchmarks and end-to-end agentic search tasks, this simple setup substantially outperforms strong sparse, dense, and reranking baselines on several BRIGHT and BEIR datasets, and attains strong accuracy on BrowseComp-Plus and multi-hop QA without relying on any conventional semantic retriever. Our results indicate that as language agents become stronger, retrieval quality depends not only on reasoning ability but also on the resolution of the interface through which the model interacts with the corpus, with which DCI opens a broader interface-design space for agentic search.

arXiv.org

Probe: AI Agent Context Engine

Probe는 AI 코딩 에이전트가 프로젝트 문서, 사양, 코드 등을 빠르게 인덱싱하고 의미 기반 및 키워드 검색을 결합해 관련 컨텍스트를 밀리초 단위로 제공하는 CLI 도구이자 MCP 서버입니다. ZeroEntropy의 최첨단 임베딩(zembed-1)과 재순위(zerank-2) 모델을 활용해 문서와 코드를 통합 검색하고, 결과를 교차 인코더로 재평가해 가장 관련성 높은 정보를 반환합니다. Claude Code, Cursor 등 MCP 호환 에이전트와 쉽게 연동되며, 자동 인덱싱과 갱신 기능을 지원해 대규모 프로젝트에서도 신속한 질의응답이 가능합니다. 현재는 실시간 파일 감시, 웹 소스 연동, Git 컨텍스트 등은 미지원 상태입니다.

https://github.com/zeroentropy-ai/probe

#aiagent #semanticsearch #embedding #reranking #zeroentropy

GitHub - zeroentropy-ai/probe: AI Agent Context Engine — give your coding agent a brain beyond code

AI Agent Context Engine — give your coding agent a brain beyond code - zeroentropy-ai/probe

GitHub

Prave – the missing management layer for AI Agent Skills

Prave는 AI 에이전트 스킬 관리를 위한 통합 플랫폼으로, 자연어 의도 기반 스킬 검색, 원클릭 설치, 그리고 스킬 사용량과 충돌을 실시간으로 감사하는 기능을 제공합니다. Claude, Cursor, Codex, Gemini, Cline, Amp 등 다양한 AI 에이전트에 동일한 스킬 포맷을 배포할 수 있어 멀티 에이전트 환경에서 효율적인 스킬 관리가 가능합니다. 또한, 30일간의 트리거 텔레메트리와 토큰 사용량 분석을 통해 비용 최적화와 성능 개선을 지원하며, 무료부터 고급 기능을 제공하는 유료 플랜까지 다양하게 구성되어 있습니다. 친환경 인프라와 데이터 프라이버시를 중시하는 점도 특징입니다.

https://prave.app/

#aiagent #skillmanagement #semanticsearch #multiagent #telemetry

Prave — The Claude Skills platform: discover, audit, ship.

Discover 1,000+ Claude Skills by intent, audit your library's token cost, track which Skills actually fire, and ship updates with one CLI command.

Prave

Searching over Session Transcripts > MEMORY.md

agent-traces는 로컬에 저장된 Claude Code 및 Codex AI 코딩 어시스턴트 세션 기록(JSONL 파일)을 의미 기반으로 검색할 수 있게 해주는 오픈소스 CLI 도구입니다. 각 세션을 사용자 프롬프트와 도구 호출 단위로 분할해 Qwen3-Embedding-8B 임베딩을 생성하고, 검색 시 사용자 의도와 도구 호출 텍스트 임베딩 점수를 조합해 관련 기록을 찾아냅니다. 모든 데이터와 인덱스는 로컬에 저장되어 개인정보 보호가 보장되며, OpenRouter API를 통해 임베딩을 수행합니다. AI 에이전트가 이전 작업을 기억하고 재활용하는 메모리 확장에 유용한 도구로, 설치와 사용법이 상세히 안내되어 있습니다.

https://github.com/edwarddgao/agent-traces

#semanticsearch #llm #embedding #agentmemory #cli

GitHub - edwarddgao/agent-traces: Agent-friendly semantic search over your local Claude Code and Codex session traces.

Agent-friendly semantic search over your local Claude Code and Codex session traces. - edwarddgao/agent-traces

GitHub

Show HN: Veles – Hybrid (BM25 and semantic) local code search MCP, in Rust

Veles는 Rust로 작성된 하이브리드(BM25와 시맨틱) 로컬 코드 검색 도구로, CPU만 사용해 빠른 응답 속도를 자랑합니다. persistent 인덱싱과 증분 업데이트를 지원하며, tree-sitter 기반 심볼 검색, 다양한 출력 포맷, gRPC 및 MCP 서버를 통해 AI 에이전트(Claude, Cursor 등)와 쉽게 통합할 수 있습니다. 멀티언어 지원과 경로 필터링, 정의 부스팅 등 실무에 유용한 기능을 갖추고 있어 AI 기반 코드 검색 및 에이전트 개발에 즉시 활용 가능합니다.

https://github.com/julymetodiev/Veles

#rust #codesearch #bm25 #semanticsearch #grpc

GitHub - julymetodiev/Veles: Fast hybrid (BM25 + semantic) local code search for AI agents - pure Rust, persistent index, MCP/gRPC servers, tree-sitter symbols

Fast hybrid (BM25 + semantic) local code search for AI agents - pure Rust, persistent index, MCP/gRPC servers, tree-sitter symbols - julymetodiev/Veles

GitHub

Show HN: Fixing AI memory blind spot on connected facts with benchmark

기존의 시맨틱 검색은 연결된 사실들을 완벽히 포착하지 못하며, 가장 의미적으로 유사한 메모리만을 찾는 한계가 있다. HotpotQA 데이터셋에서 벡터 검색과 BM25에 엔티티 그래프를 결합한 방식이 BothFound@5 점수를 71.5%로 크게 향상시켰고, 이는 엔티티 그래프가 연결된 사실 추출에 핵심 역할을 함을 보여준다. 추가 벤치마크 결과에서도 엔티티 그래프 활용이 장기 메모리 평가와 연결된 사실 검색에서 우수한 성능을 나타냈다. AI 메모리 및 지식 검색 시스템에서 연결된 사실을 효과적으로 회수하는 새로운 접근법으로 주목된다.

https://yourmemoryai.xyz/

#semanticsearch #entitygraph #benchmark #connectedfacts #aiengineering

YourMemory — Persistent Memory for AI Agents

Your AI assistant forgets you after every session. YourMemory fixes that — biologically-inspired memory decay, hybrid graph + vector retrieval, 59% Recall@5 on LoCoMo-10. MCP compatible.

YourMemory

Show HN: Obsidian-Semantic, a CLI that lets agents search your vault by meaning

Obsidian-Semantic은 CLI 기반 도구로, AI 에이전트가 Obsidian 노트 저장소를 의미 기반으로 검색할 수 있게 해줍니다. 이를 통해 에이전트가 단순 텍스트 검색을 넘어 노트 간의 연관성을 찾아내고, 점차 위키처럼 지식을 확장할 수 있습니다. Ollama, LMStudio의 로컬 임베딩 모델과 Gemini API 클라우드 모델을 지원해 모델 선택과 제어가 가능합니다. AI 에이전트와 개인 지식 관리 통합에 유용한 도구입니다.

https://github.com/ravila4/obsidian-semantic-search

#obsidian #semanticsearch #embedding #cli #aiagent

GitHub - ravila4/obsidian-semantic-search: Semantic search for Obsidian vaults using LanceDB and Gemini/Ollama embeddings

Semantic search for Obsidian vaults using LanceDB and Gemini/Ollama embeddings - ravila4/obsidian-semantic-search

GitHub

I am underwhelmed by AI search

저자는 AI 기반 검색 도구들이 기존의 정교한 부울 검색 기법을 대체하지 못하고 오히려 잘못된 정보 확산 위험을 내포한다고 평가한다. 특히 학술 연구 분야에서 AI 검색은 신뢰성 문제와 생성 텍스트의 과잉 자신감으로 인해 사용자가 잘못된 결론에 이를 수 있으며, 이는 경험 부족한 사용자에게 더 큰 문제로 작용한다. 현재 AI 검색 도구들은 의미 기반 검색의 잠재력을 충분히 발휘하지 못하고 있으며, 기존의 고급 검색 기술을 완전히 대체하기에는 한계가 크다. 저자는 AI가 검색 과정을 보조하되 사용자의 해석 자율성을 침해하지 않는 도구 개발을 희망한다.

https://hannahshelley.neocities.org/blog/2026_04_08_AIsearch

#aisearch #llm #rag #semanticsearch #academicresearch

I am underwhelmed by AI search

I wanted AI to replace me. So why hasn't it?

Microsoft Agent Framework - Building Blocks for AI Part 3 - .NET Blog

Build intelligent AI agents in .NET with the Microsoft Agent Framework. Learn how to create agents with tools, multi-turn conversations, memory, and graph-based workflows that bring together the building blocks from Parts 1 and 2.

.NET Blog

QMD는 마크다운, 회의록 등 개인 문서를 로컬에서 색인·검색하는 온디바이스 검색 엔진입니다. BM25·벡터·LLM 재랭킹을 결합하고 node-llama-cpp와 GGUF 모델을 활용합니다. CLI·SDK로 컬렉션 추가·임베딩·검색·문서 조회가 가능하며, MCP(stdio/HTTP) 서버로 Claude 통합 및 플러그인 연동을 지원합니다.

https://github.com/tobi/qmd

#qmd #localai #semanticsearch #mcp #embeddings

GitHub - tobi/qmd: mini cli search engine for your docs, knowledge bases, meeting notes, whatever. Tracking current sota approaches while being all local

mini cli search engine for your docs, knowledge bases, meeting notes, whatever. Tracking current sota approaches while being all local - tobi/qmd

GitHub