[Перевод] Agentis Memory — Redis-совместимое хранилище со встроенным векторным поиском и локальными эмбеддингами

В наше время уже никого не удивишь разработкой агентов, очередной оптимизацией, новой моделью или новой инфраструктурой для нейронок. Всё это в порядке вещей. Однако одно дело читать в Twitter «мы написали агента X и он оптимизировал нам процессы на 300000%», и совсем другое — начать копать чуть глубже. Копнёшь — а «агентом» называют скилл с одним промптом. Разработка настоящих агентов — задача не тривиальная. Достаточно посмотреть на утёкшие исходники Claude CLI — это не просто CLI, а целая инфраструктура бизнес-логики вокруг LLM. Я бы сравнил разработку агентов с разработкой типичных бэкенд-компонентов. Аналогия такая: если вы пишете каноничный бэкенд-сервис — вам нужна СУБД. Если Web3-сервис — блокчейн. Но на СУБД или блокчейне происходит в лучшем случае 50% всей логики. Вся магия крутится именно на бэкенде. С агентами то же самое: подключаешь AI SDK, конфигурируешь мыслительное ядро и пишешь вокруг него всю обвязку — мониторинги, AIOps, оркестрацию, memory management. Вот про memory management и пойдёт речь.

https://habr.com/ru/articles/1018784/

#Redis #AI_agents #GraalVM #ONNX #embeddings #HNSW #Java_Vector_API #SIMD #Project_Loom #LLM

Agentis Memory — Redis-совместимое хранилище со встроенным векторным поиском и локальными эмбеддингами

Примечание: это перевод моей же статьи https://scrobot.substack.com/p/agentis-memory-redis-compatible-store , так что автор точно доносит свою мысль, без потери контекста при переводе :) В наше время...

Хабр

Microsoft가 Harrier-OSS-v1 임베딩 패밀리(270M·0.6B·27B)를 공개했다. 디코더 전용 아키텍처와 라스트토큰 풀링, 32k 토큰 컨텍스트를 지원하며 쿼리측 인스트럭션 튜닝으로 동작한다. Multilingual MTEB v2에서 SOTA를 기록했고, 소형 모델은 지식증류로 성능을 보강했다.

https://www.marktechpost.com/2026/03/30/microsoft-ai-releases-harrier-oss-v1-a-new-family-of-multilingual-embedding-models-hitting-sota-on-multilingual-mteb-v2/

#microsoft #harrier #embeddings #multilingual #rag

Learn what text embeddings are, how they power RAG and semantic search, and how to call embedding APIs from Python using Ollama or an OpenAI-compatible server (for example llama.cpp). Includes persistence, retrieval, and links to chunking, vector stores, and reranking on this site.

#Embeddings #RAG #Python #Ollama #LLM #Self-Hosting #Vector Database

https://www.glukhov.org/rag/embeddings/

Text embeddings for RAG and search - Python, Ollama, OpenAI-compatible APIs

Learn what text embeddings are, how they power RAG and semantic search, and how to call embedding APIs from Python using Ollama or an OpenAI-compatible server (for example llama.cpp). Includes persistence, retrieval, and links to chunking, vector stores, and reranking on this site.

Rost Glukhov | Personal site and technical blog

Step-by-step RAG tutorial: build retrieval-augmented generation systems with vector databases, hybrid search, reranking, and web search. Architecture, implementation, and production best practices.

#AI #LLM #RAG #Embeddings #Reranking #Vector Database

https://www.glukhov.org/rag/

Retrieval-Augmented Generation (RAG) Tutorial: Architecture, Implementation, and Production Guide

Step-by-step RAG tutorial: build retrieval-augmented generation systems with vector databases, hybrid search, reranking, and web search. Architecture, implementation, and production best practices.

Rost Glukhov | Personal site and technical blog

Big update to Embeddings Playground! You no longer need to enter an API key when you want to play with commercial models from OpenAI, Mistral, or Google.

Try it here:
https://embeddings.svana.name/

#nlp #ml #ai #embeddings #llm #openai

Text embeddings for RAG and search - Python, Ollama, OpenAI-compatible APIs:
https://www.glukhov.org/rag/embeddings/
#Embeddings #RAG #Python #Ollama #LLM #SelfHosting #VectorDatabase
Text embeddings for RAG and search - Python, Ollama, OpenAI-compatible APIs

Learn what text embeddings are, how they power RAG and semantic search, and how to call embedding APIs from Python using Ollama or an OpenAI-compatible server (for example llama.cpp). Includes persistence, retrieval, and links to chunking, vector stores, and reranking on this site.

Rost Glukhov | Personal site and technical blog

TIL: truncating note bodies to 300 characters and front-loading #embeddings with structured metadata (title, tags, wiki-links) pushed my #obsidian vault recommender’s recall up significantly. The frontmatter I was already including in each note turned out to be the highest-signal input for the embedding model.

https://anoliphantneverforgets.com/til/2026-03-24-shorter-embedding-body-improves-recall

TIL: Shorter Embedding Body Improves Semantic Search Recall ~ An Oliphant Never Forgets

An Oliphant Never Forgets - notes, learnings, and bookmarks from Joshua Oliphant

Forscher der Harvard University präsentieren ein Framework, das die Homogenisierung in KI-Modellen verhindert. Durch Eingriffe in die Embeddings beim Fine-Tuning wird eine breitere mathematische Suche erzwungen. Die Methode bewahrt das Reasoning der Systeme und erhöht die Rate der Halluzinationen nicht.

#HarvardUniversity #KünstlicheIntelligenz #Embeddings #OpenSource #News
https://www.all-ai.de/news/beitrage2026/harvard-studie-kreativitaet

Harvard-Studie: So werden KI-Modelle dauerhaft kreativ

Ein neues Framework löst das Problem monotoner KI-Texte. Modelle generieren endlich vielfältigere und konstantere Antworten.

All-AI.de

Decided to rewrite the backend of my Embeddings playground ... in Rust. I work in Python all the time at my job, and I'm getting a bit bored with it. So, in my side projects, I want to explore other languages and technologies.

#rust #python #machinelearning #embeddings

A full day building a production-grade RAG system.🚀

This #ArcofAI workshop with Wesley Reisz covers ingestion, transcription,
embeddings, vector search, orchestration with Step Functions, and MCP
integration.

https://www.arcofai.com/speaker/7d1e0ac0820b49f0ac378365a185de1c

🎟️ Get tickets: https://arcofai.com

#AI #RAG #VectorSearch #Embeddings #GenAI #AgenticAI #AustinTech #Austin #Developer #AIEngineering