Mastodawn

Графы знаний в юридическом домене: эксперимент с LightRAG

Юридический домен требует понимания многочисленных связей между сущностями, рассеянными по множеству документов. Поэтому кажется, что область знаний, организованная таким образом, идеально может быть представлена в виде графа знаний: связи между нормами, прецедентами и понятиями, рассеянными по тысячам документов, наконец-то перестают теряться. Современные фреймворки обещают построить такой граф автоматически, в пару команд. Но между "запуском из коробки" и рабочей аналитической системой на практике лежит немалая дистанция. Это первая часть практического эксперимента с LightRAG, одним из самых известных графовых фреймворков. На небольшом корпусе из Гражданского кодекса РФ и судебной практики разбираем, как фреймворк устроен, как его быстро развернуть, и почему граф из "коробки", без оптимизации и тонкой настройки, при всей внешней убедительности, еще не готов к полноценной работе в юридическом домене.

https://habr.com/ru/articles/1036652/

#RAG #retrievalaugmented_generation #ai #artificial_intelligence #llm #large_language_models #vector_database #graph_database #knowledge_graphs #lightrag

Графы знаний в юридическом домене: эксперимент с LightRAG

интерактивная визуализация графа знаний в WebUI LightRAG Принципиальные ограничения классического векторного поиска при проектировании и развертывании AI‑систем в сложных доменах...

Хабр

Franco Lombardo 🇺🇦Apr 25

I'm very proud to be part of it!!
#AI #LLM #PHP #vector_database
https://laravel-news.com/llphant-a-php-generative-ai-framework-inspired-by-langchain

LLPhant: A PHP Generative AI Framework Inspired by LangChain

LLPhant is a PHP framework for building Generative AI applications with support for multiple LLM providers, embeddings, vector stores, and RAG capabilities.

Laravel News

Habr Apr 8

OpenClaw и память без амнезии: что выбрать между Lossless Claw, OpenViking, ByteRover, MemPalace и LLM Wiki

Когда говорят «память для ИИ-агента», очень легко начать спорить о разном, думая, что обсуждается одно и то же. Один человек хочет, чтобы агент не забывал длинные рабочие диалоги. Другой ждёт от памяти нормальную базу знаний по проекту. Третий хочет отдельный контекстный слой уровня платформы, где рядом живут документы, навыки, пользовательские предпочтения и служебные данные. Четвёртому вообще не нравится идея, что модель заранее решает, что важно, а что можно выбросить. А пятый хочет не архив и не векторную базу, а живую внутреннюю wiki, которую агент сам поддерживает в актуальном состоянии. На OpenClaw эта развилка видна особенно хорошо. У платформы уже есть понятная архитектура плагинов и отдельный слот plugins.slots.contextEngine , куда можно подключать внешний движок контекста. А в последнем обновлении OpenClaw 2026.4.7 в вернули и встроенный memory-wiki stack — то есть подход с накопительной wiki уже перестал быть просто красивой идеей из заметки и стал частью реального инструментария. Если смотреть на самые интересные подходы к памяти для OpenClaw прямо сейчас, то разговор крутится вокруг пяти систем и направлений:

https://habr.com/ru/articles/1020860/

#openclaw #ai_agent #rag #vector_database #embeddings #memory #ии #ииагенты #openclaw_tutorial #wiki

OpenClaw и память без амнезии: что выбрать между Lossless Claw, OpenViking, ByteRover, MemPalace и LLM Wiki

Когда говорят «память для ИИ-агента», очень легко начать спорить о разном, думая, что обсуждается одно и то же. Один человек хочет, чтобы агент не забывал длинные рабочие диалоги. Другой ждёт от...

Хабр

bot Mar 30

RAG 이후의 검색: 하이브리드 검색과 에이전트를 위한 데이터베이스 설계 - Turbopuffer 사이먼 에스킬센

Turbopuffer는 기존 벡터 데이터베이스의 막대한 비용 문제를 해결하기 위해 S3 객체 스토리지와 NVMe SSD를 결합한 새로운 계층형 스토리지 아키텍처를 제안한다.

🔗 원문 보기

RAG 이후의 검색: 하이브리드 검색과 에이전트를 위한 데이터베이스 설계 - Turbopuffer 사이먼 에스킬센

Turbopuffer는 기존 벡터 데이터베이스의 막대한 비용 문제를 해결하기 위해 S3 객체 스토리지와 NVMe SSD를 결합한 새로운 계층형 스토리지 아키텍처를 제안한다.

Ruby-News | 루비 AI 뉴스

Habr Mar 20

Графы знаний в юридическом домене: как не потерять сложность при построении RAG-системы

Ни одна современная AI-система в юридическом домене не обходится без RAG: юридические данные слишком специфичны, слишком изменчивы и никогда слишком редко составляли значимую часть обучающей выборки LLM, чтобы доверять ей без внешней базы знаний. Обычно при построении RAG-системы используют модуль поиска, основанный на векторных БД. Однако в таких сложно организованных областях знаний, как юридическая, архитектура, основанная на поиске в хранилище "плоских" эмбеддингов, может не справиться. Векторный поиск позволяет находить семантически близкие (схожие) фрагменты текстов, тогда как юридический домен также требует понимания многочисленных связей между сущностями , рассеянными по множеству документов . Кажется, что область знаний, организованная таким образом, идеально может быть представлена в виде графа знаний, особенно после появления современных инструментов, позволяющих автоматически строить такие графы на тысячах документов и использовать их в качестве хранилища знаний для RAG-систем. Однако все имеет свою цену: неполнота или неточность построенного графа может свести на нет все вложенные ресурсы и оставить вас с системой, которая хуже "наивного" векторного поиска. Какие преимущества поиска по графу знаний по сравнению с классическим векторным поиском, а также каковы критерии, когда использование графового поиска действительно необходимо для построения RAG-системы в юридическом домене?

https://habr.com/ru/articles/1012556/

#RAG #retrievalaugmented_generation #ai #artificial_intelligence #llm #large_language_models #vector_database #graph_database #knowledge_graphs #graphrag

Графы знаний в юридическом домене: как не потерять сложность при построении RAG-системы

Графы знаний в RAG-системах - будущее интеллектуального поиска Ни одна современная AI‑система в юридическом домене сегодня не обходится без Retrieval Augmented Generation (RAG): она...

Хабр

Habr 25+Mar 17

AAF: Архитектура автономного ИИ-агента с GraphRAG, EventBus и Docker-песочницей

В нашем сообществе уже не первый день живёт агент @vega_exactly_not_ai . Его создатель @th0r3nt открыл исходный код на GitHub - чтобы мы вместе могли решить фундаментальные проблемы. На сегодня это самое стабильное решение автономного агента с личным Telegram-аккаунтом. Создатель попросил рассказать об архитектуре и поставить ряд вопросов перед сообществом. Думаю, вместе мы способны разобраться. Большинство современных Open-Source фреймворков для создания ИИ-агентов (от AutoGPT до недавнего OpenClaw) страдают от ряда детских болезней. Во-первых, это амнезия: агент теряет контекст спустя десяток шагов, так как векторные базы данных превращают память в кашу из семантически похожих, но логически не связанных кусков текста. Во-вторых, это зацикливание в бесконечных ReAct-петлях. В-третьих - ужасная безопасность при выполнении сгенерированного кода прямо на хостовой машине. В этой статье я хочу разобрать архитектуру Autonomous Agent Framework (AAF) - моего pet-проекта, который перерос в полноценную OS-level сущность на Python. Главная идея AAF: агент не должен быть просто скриптом, ожидающим промпта. Это должен быть долгоживущий асинхронный процесс с гибридной памятью, шиной событий и собственной изолированной средой для запуска субагентов.

https://habr.com/ru/articles/1010522/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1010522

#opensource #openclaw #agentos #agent #python #vector_database #graphrag #aiагенты #агенты_ии #docker_swarm

AAF: Архитектура автономного ИИ-агента с GraphRAG, EventBus и Docker-песочницей

В нашем сообществе уже не первый день живёт агент @vega_exactly_not_ai . Его создатель th0r3nt открыл исходный код на GitHub - чтобы мы вместе могли решить фундаментальные проблемы. На сегодня это...

Хабр

Habr Mar 17

AAF: Архитектура автономного ИИ-агента с GraphRAG, EventBus и Docker-песочницей

В нашем сообществе уже не первый день живёт агент @vega_exactly_not_ai . Его создатель @th0r3nt открыл исходный код на GitHub - чтобы мы вместе могли решить фундаментальные проблемы. На сегодня это самое стабильное решение автономного агента с личным Telegram-аккаунтом. Создатель попросил рассказать об архитектуре и поставить ряд вопросов перед сообществом. Думаю, вместе мы способны разобраться. Большинство современных Open-Source фреймворков для создания ИИ-агентов (от AutoGPT до недавнего OpenClaw) страдают от ряда детских болезней. Во-первых, это амнезия: агент теряет контекст спустя десяток шагов, так как векторные базы данных превращают память в кашу из семантически похожих, но логически не связанных кусков текста. Во-вторых, это зацикливание в бесконечных ReAct-петлях. В-третьих - ужасная безопасность при выполнении сгенерированного кода прямо на хостовой машине. В этой статье я хочу разобрать архитектуру Autonomous Agent Framework (AAF) - моего pet-проекта, который перерос в полноценную OS-level сущность на Python. Главная идея AAF: агент не должен быть просто скриптом, ожидающим промпта. Это должен быть долгоживущий асинхронный процесс с гибридной памятью, шиной событий и собственной изолированной средой для запуска субагентов.

https://habr.com/ru/articles/1010522/

#opensource #openclaw #agentos #agent #python #vector_database #graphrag #aiагенты #агенты_ии #docker_swarm

AAF: Архитектура автономного ИИ-агента с GraphRAG, EventBus и Docker-песочницей

В нашем сообществе уже не первый день живёт агент @vega_exactly_not_ai . Его создатель th0r3nt открыл исходный код на GitHub - чтобы мы вместе могли решить фундаментальные проблемы. На сегодня это...

Хабр

Hacker News Jan 14

ChromaDB Explorer
https://www.chroma-explorer.com/
#ycombinator #ChromaDB #vector_database #embeddings #desktop_app #macOS #database_client #machine_learning #semantic_search

Chroma Explorer - Modern ChromaDB Desktop Client

A beautiful, native desktop application for exploring and managing your ChromaDB vector databases.

Chroma Explorer

Hacker News Nov 6, 2025

Benchmarking the Most Reliable Document Parsing API
https://www.tensorlake.ai/blog/benchmarks
#ycombinator #context_engineering #document_processing #machine_learning #LLM #RAG #vector_database #knowledge_graphs #document_parsing #structured_extraction #AI_workflows #Document_Parsing #OCR #Benchmarks #TEDS #Enterprise_AI

Benchmarking the Most Reliable Document Parsing API | Tensorlake

Learn how Tensorlake built the most reliable document parsing API by measuring what actually matters: structural preservation, reading order accuracy, and downstream usability. See benchmark results comparing Tensorlake to Azure, AWS Textract, and open-source solutions on real enterprise documents.

Tensorlake

Habr Nov 6, 2025

Домашняя векторная БД + RAG

Часто приходится искать в огромной куче документов какую нибудь частную, специфичную вещь. На данный момент, только лично у меня более 2Gb различных pdf файлов. Зачастую разбросанных не системно. И хотя обычно представляешь где искать, но это отнимает время. Захотелось иметь инструмент ускоряющий поиск.

https://habr.com/ru/articles/963278/

#ai #rag #vector_database #векторная_база_данных #ии

Домашняя векторная БД + RAG

Пример поиска Исходная идея Часто приходится искать в огромной куче документов какую нибудь частную, специфичную вещь. На данный момент, только лично у меня более 2Gb различных pdf файлов. Зачастую...

Хабр