AA (@measure_plan)
사진 검색·뷰잉 실험: threejs 인터페이스 위에 smolVLM + Roboflow RF-DETR 기반 컴퓨터 비전과 ChromaDB 시맨틱 검색을 결합해, 도시·색상·객체 같은 자연어로 전체 사진 라이브러리를 검색할 수 있게 구성한 사례를 공유함.
AA (@measure_plan)
사진 검색·뷰잉 실험: threejs 인터페이스 위에 smolVLM + Roboflow RF-DETR 기반 컴퓨터 비전과 ChromaDB 시맨틱 검색을 결합해, 도시·색상·객체 같은 자연어로 전체 사진 라이브러리를 검색할 수 있게 구성한 사례를 공유함.
AA (@measure_plan)
로컬의 무료 AI 모델들을 활용해 컴퓨터에 있는 오래된 여행 사진을 자연어로 검색하는 앱을 제작한 사례: smolVLM으로 장면·색상 설명, Roboflow RF-DETR로 객체 검출, ChromaDB에 메타데이터 저장·시맨틱 검색을 수행하고 Python과 Streamlit으로 UI를 구현했습니다.

i built an app to search old travel photos on my computer with natural language queries using free local AI models: - smolVLM to describe the scene and colours - roboflow RF-DETR to detect objects - chromaDB to store metadata labels and run semantic search - python + streamlit
Как мы с ИИ сделали локальный ИИ, который учится по моим книгам и пишет за меня отчёты
Я с GitHub Copilot (Claude) собрал полностью локальную RAG-систему с GUI, которая индексирует мои учебники и генерирует по ним отчёты, презентации, конспекты и эссе. Всё работает офлайн. В статье — архитектура, выбор компонентов, процесс совместной разработки с ИИ-ассистентом, грабли и рабочий код.
Базовый минимум. Часть 3: RAG-системы
Большая языковая модель это не источник актуальных сведений, а статистическая система, обученная на данных прошлого. Она не обращается к внешним базам знаний и не узнает о новых событиях. Все что она знает было усвоено на этапе обучения и зафиксировано в ее параметрах. В современных прикладных системах это ограничение часто скрыто за инструментами, поиском и дополнительными модулями. Однако именно архитектурный подход Retrieval-Augmented Generation, RAG стал стандартным способом расширения возможностей модели без ее дообучения. Он позволяет подключать внешние базы знаний, работать с актуальными документами и заметно снижать количество галлюцинаций. В третьей части серии Базовый минимум разбирается как устроен RAG и как реализовать его минимальную рабочую версию на практике.
https://habr.com/ru/articles/1002152/
#RAG #RetrievalAugmented_Generation #языковые_модели #векторная_база_данных #эмбеддинги #чанкование #семантический_поиск #векторный_индекс #ChromaDB #Hugging_Face
Мой локальный агент помнит проект лучше меня. Контекст — 32K токенов. Расскажу, как
Мой агент на Llama 3.1 8B в третий раз спросил, как меня зовут. Я представился 200 сообщений назад. Контекст переполнился — начало разговора уехало. Большие контексты не спасают: дорого, «Lost in the Middle», локально не влезает. Суммаризация теряет детали. Я сделал по-другому — три типа внешней памяти: Redis для фактов, ChromaDB для семантического поиска, файлы для документов. Контекст маленький, память большая. Внутри — код на Python и грабли, на которые я уже наступил.
https://habr.com/ru/articles/994618/?utm_source=habrahabr&utm_medium=rss&utm_campaign=994618
#LLM #AIагенты #память_LLM #RAG #Redis #ChromaDB #векторный_поиск #sentencetransformers #llama #локальные_модели
Мой локальный агент помнит проект лучше меня. Контекст — 32K токенов. Расскажу, как
Мой агент на Llama 3.1 8B в третий раз спросил, как меня зовут. Я представился 200 сообщений назад. Контекст переполнился — начало разговора уехало. Большие контексты не спасают: дорого, «Lost in the Middle», локально не влезает. Суммаризация теряет детали. Я сделал по-другому — три типа внешней памяти: Redis для фактов, ChromaDB для семантического поиска, файлы для документов. Контекст маленький, память большая. Внутри — код на Python и грабли, на которые я уже наступил.
https://habr.com/ru/articles/994618/
#LLM #AIагенты #память_LLM #RAG #Redis #ChromaDB #векторный_поиск #sentencetransformers #llama #локальные_модели