How to Build Vector Search from Scratch in Python

이 글은 Python과 NumPy만 사용해 벡터 검색 엔진을 처음부터 구현하는 방법을 상세히 설명한다. 텍스트를 고차원 임베딩 벡터로 변환해 코사인 유사도로 의미적 근접성을 측정하는 벡터 검색의 기본 원리를 다루며, 간단한 상품 설명 데이터셋을 활용해 임베딩 생성, 정규화, 인덱싱, 검색 쿼리 처리 과정을 단계별로 보여준다. 또한 PCA를 이용해 임베딩 공간을 2차원으로 시각화해 클러스터 구조와 쿼리 벡터의 위치를 직관적으로 이해할 수 있도록 한다. 벡터 검색의 핵심 개념과 구현 원리를 이해하고자 하는 AI 개발자에게 실용적인 입문 자료다.

https://www.kdnuggets.com/how-to-build-vector-search-from-scratch-in-python

#vectorsearch #python #embedding #cosinesimilarity #pca

How to Build Vector Search from Scratch in Python

Learn how to build a vector search engine from scratch in Python with embeddings, similarity scoring, and basic retrieval logic.

KDnuggets

Deep Dive: Vector Search in Hermes Memory

SQLite vector search implementation details.

#memory #vectorsearch #sqlite

Building an AI Agent with Persistent Memory: A Technical Deep Dive

A technical look at how Hermes Agent implements cross-session persistent memory using SQLite vector search and knowledge graphs.

#ai #agents #memory #vectorsearch #opensource

Use Redis with SQL

Redis에서 SQL과 유사한 쿼리를 실행할 수 있는 sql-redis 라이브러리가 PyPi에 공개되었다. 이 라이브러리는 SQLQuery 클래스를 통해 SQL 문을 Redis의 FT.SEARCH, FT.AGGREGATE 명령어로 변환하여 Redis의 빠른 속도로 쿼리를 수행한다. 기본적인 SELECT 문뿐 아니라 집계, 전체 텍스트 검색, 벡터 검색, 지리 공간 쿼리, 비동기 실행도 지원하며, LLM 없이 deterministic하게 동작한다. RedisVL 패키지에 포함되어 있어 간단한 설치와 사용법으로 Redis 인덱스에 친숙한 SQL 문법으로 접근 가능하다. AI 개발자들이 Redis를 데이터 저장소로 활용하면서 SQL 친화적인 쿼리 경험을 얻기에 유용하다.

https://redis.io/blog/use-redis-with-sql/

#redis #sql #vectorsearch #fulltextsearch #python

Use Redis with SQL | Redis

Developers love Redis. Unlock the full potential of the Redis database with Redis Enterprise and start building blazing fast apps.

Redis

Google for Developers (@googledevs)

Gemini Embedding 2가 Matryoshka Representation Learning(MRL)을 활용해 임베딩 효율을 높인다는 내용입니다. 벡터를 동적으로 잘라 고속 후보 매칭을 하면서도 정밀도를 유지하고, 더 작은 저장소로 데이터베이스 비용도 줄일 수 있다고 소개합니다.

https://x.com/googledevs/status/2051773542513947092

#gemini #embeddings #mrl #vectorsearch #ai

Google for Developers (@googledevs) on X

Matryoshka dolls 🪆 = the key to AI efficiency. Gemini Embedding 2 leverages Matryoshka Representation Learning (MRL) so you can: 🔹 Dynamically truncate vectors for high-speed candidate matching without losing precision 🔹Slash database costs by choosing a smaller storage

X (formerly Twitter)

#VirtualThreads aren’t just a #Java hype feature. This article shows them powering agent calls safely in production-style #Microservices—with fallback + observability.

Steal the blueprint by @sibaspadhi: https://javapro.io/2026/01/22/java-25-genai-a-new-era-for-microservices-in-finance/

#SpringBoot #GenAI #Observability #VectorSearch

BoxLang AI 3.0 Series · Part 6 of 7 A chatbot with no memory isn't a conversation — it's a series of isolated queries. Every message starts from scratch. The user has to re-explain who they are, what they're working on, and what was just said. It's...
#AIagents #BoxLang #DATAENGINEERING #Developertools #Embeddings #Java #JVM #LLM #MemorySystems #rag #RetrievalAugmentedGeneration #VectorSearch
https://foojay.io/today/boxlang-ai-deep-dive-part-6-of-7-memory-systems-rag-building-ai-that-remembers/
foojay – a place for friends of OpenJDK

foojay is the place for all OpenJDK Update Release Information. Learn More.

foojay
What are the best developer tools built around Markdown?

18 comments

Lobsters

Sau (@cachesaur)

LLM이 복잡한 다단계 추론에서 관계형 DB보다 그래프 DB에 더 잘 맞는 이유를 설명한다. 벡터 검색은 의미적 유사성에는 강하지만, 스키마 같은 구조적 정보에는 약해 관계형 스키마에서 LLM 성능이 떨어진다는 점을 지적한다.

https://x.com/cachesaur/status/2046857825104900184

#llm #graphdb #relationaldb #vectorsearch #reasoning

Sau (@cachesaur) on X

@_avichawla This is precisely why LLMs are more fluent in graph DBs as compared to relational DBs for complex multi-hop reasoning. Theoretically why LLMs suck at relational schemas, is because vector search is meant for semantic not for structural schemas

X (formerly Twitter)

📖 Perfect prep for this #JCON2025 workshop:
🔹 Building Powerful GenAI Apps with Pure Java (16:00)

@RichardFichtner’s article “Build Vector Database Apps with Pure Java”
👉 https://javapro.io/2026/04/02/build-vector-database-apps-with-pure-java/

#Java #EclipseStore #MicroStream #GenAI #LLM #Vectors #VectorSearch