Mastodawn

Графы знаний в юридическом домене: эксперимент с LightRAG

Юридический домен требует понимания многочисленных связей между сущностями, рассеянными по множеству документов. Поэтому кажется, что область знаний, организованная таким образом, идеально может быть представлена в виде графа знаний: связи между нормами, прецедентами и понятиями, рассеянными по тысячам документов, наконец-то перестают теряться. Современные фреймворки обещают построить такой граф автоматически, в пару команд. Но между "запуском из коробки" и рабочей аналитической системой на практике лежит немалая дистанция. Это первая часть практического эксперимента с LightRAG, одним из самых известных графовых фреймворков. На небольшом корпусе из Гражданского кодекса РФ и судебной практики разбираем, как фреймворк устроен, как его быстро развернуть, и почему граф из "коробки", без оптимизации и тонкой настройки, при всей внешней убедительности, еще не готов к полноценной работе в юридическом домене.

https://habr.com/ru/articles/1036652/

#RAG #retrievalaugmented_generation #ai #artificial_intelligence #llm #large_language_models #vector_database #graph_database #knowledge_graphs #lightrag

Графы знаний в юридическом домене: эксперимент с LightRAG

интерактивная визуализация графа знаний в WebUI LightRAG Принципиальные ограничения классического векторного поиска при проектировании и развертывании AI‑систем в сложных доменах...

Хабр

42rows 40m ago

🚀 Open-sourced wiki42: a Python library that compiles your markdown wiki into RAG-ready chunks for any vector DB.

✦ 1 chunk = 1 page (no token-split)
✦ YAML frontmatter as metadata
✦ [[wikilinks]] resolved
✦ Multilingual E5 embeddings
✦ MIT, drop-in for Pinecone Inference

→ github.com/42ROWS/wiki42
→ 42rows.com/guides/wiki42

#opensource #python #rag #llm

Habr 2h ago

Почему ИИ-боты более уязвимы, чем их базовые LLM-модели?

В прошлой статье я показал, как защищен Open Source проект телеграм-бота. В комментариях меня спросили о иных инструментах и методах проверки в связи с чем, мы вышли к ключевому вопросу: почему, если основная LLM защищена, кастомные боты на ее основе остаются уязвимыми? Базовые LLM проходят отдельное safety-training и RLHF-выравнивание. Но production-бот, построенный поверх модели, добавляет новый attack surface: system prompts, память диалога, RAG, tools, webhook-логику и внешние API. Именно этот orchestration layer часто становится слабым местом. Вот данные: Из анализа 14 904 кастомных GPT :

https://habr.com/ru/articles/1036854/

#llm_security #prompt_injection #jailbreak #red_teaming #telegram_bot #webhook #rag #ai_safety #gpt

Почему ИИ-боты более уязвимы, чем их базовые LLM-модели?

В прошлой статье я показал, как защищен Open Source проект телеграм-бота. В комментариях меня спросили о иных инструментах и методах проверки в связи с чем, мы вышли к ключевому вопросу: почему, если...

Хабр

NobodyWho 2h ago

NobodyWho now supports #Swift 🎉

Run #LLMs fully on-device in your #iOS, #macOS, #watchOS & #visionOS apps. No internet. No API keys. No usage fees.

→ #Gemma4, #Qwen & more (.gguf)
→ Hardware acceleration
→ Tool calling, #RAG, vision & audio ingestion
→ Open-source & free

https://github.com/nobodywho-ooo/nobodywho

Habr 3h ago

Pollux: LLM-as-a-judge для русского

Прошло несколько лет с тех пор, как нейросетевые модели стали применимы в генерации текста. Сегодня языковые модели уверенно решают задачи написания кода, поддержки диалогов и планирования маршрутов. Тем не менее, до сих пор не сложилось универсального подхода для валидации LLM перед их внедрением в цифровые продукты. Но у нас есть решение! В этой статье я расскажу, как мы в Sber AI обучили специализированного LLM-судью (LLM-as-a-Judge) Pollux для оценки русскоязычных LLM. Мы выложили его в открытый доступ и вы можете встроить его в свой продукт уже сегодня. Читать далее и оценивать

https://habr.com/ru/companies/sberbank/articles/1036650/

#llmагент #llmмодели #llm #llmasajudge #rag #метрики_продукта

Pollux: LLM-as-a-judge для русского

Прошло несколько лет с тех пор, как нейросетевые модели стали применимы в генерации текста. Сегодня языковые модели уверенно решают задачи написания кода, поддержки диалогов и планирования маршрутов....

Хабр

Dragone2

5h ago

Scopri di più su Flowise AI su Linux e inizia a usarlo in self-hosting per creare chatflow, workflow AI e primi esperimenti con strumenti open source (RAG con Ollama).

🔗 https://www.risposteinformatiche.it/flowise-ai-locale-linux-guida-pratica/

@linux @opensource

#Flowise #AI #OpenSource #SelfHosted #Linux #Docker #LLM #Automation #UnoOpenSource #UnoLinux #Ollama #RAG

Flowise AI in locale su Linux: guida pratica passo passo - Risposte Informatiche

Guida pratica per installare Flowise AI in locale su Linux con Docker o NPM e creare il primo chatflow passo passo in self-hosting.

Risposte Informatiche

Dragone2 8h ago

Flowise AI in locale su Linux: guida pratica passo passo

https://www.risposteinformatiche.it/flowise-ai-locale-linux-guida-pratica/

Habr 9h ago

Некорпоративный Хабр: семантический поиск и фильтрация по структурированным полям

Классический RAG индексирует исходный текст документа, предварительно разбивая на фрагменты. Потом рассчитывает векторное представление фрагментов и сохраняет их векторные представления в базу данных для поиска. Это дает возможность искать по сходству фрагментов текста и поискового запроса пользователя, но не дает возможность искать по более высокоуровневым резюме и смыслам, темам поднятым в тексте и прочему. Также не помогает с аналитикой по содержимому. Бесплатный проект text-metadata-generator позволяет выполнять запросы к LLM по каждому документу из коллекции документов, результаты вывода LLM проверяются по JSON схеме. Зачем может пригодиться эта программа и подход со структурированием текстовой информации своя библиотека с каталогом - поиск по локальным документам с использованием комбинации SQL предикатов и семантического поиска аналитика по документам, возможность находить новое в текстах: комбинируя структурированные поля созданные LLM из исходного текста, и находя закономерности с уже существующими в документе метаданными. Например, связывая с рейтингом признак NSFW, тон повествования, полноту содержания итп. разгрести “авгиевы конюшни” личных заметок в Obsidian или git репозитарии с Markdown файлами Рассмотрим как работает данный подход на 13275 статьях с Хабра, а также текстах трех песнен…

https://habr.com/ru/articles/1036594/

#семантический_поиск #структурирование_инфомации #локальный_поиск_по_документам #эмбеддинги #duckdb_wasm #wllama #llmприложения #sql #rag #llm

Некорпоративный Хабр: семантический поиск и фильтрация по структурированным полям

Классический RAG индексирует исходный текст документа, предварительно разбивая на фрагменты. Потом рассчитывает векторное представление фрагментов и сохраняет их векторные представления в базу данных...

Хабр

Show thread

algodesigner 10h ago

🧵 (2/2) Forked the project closest to the vision and dived into coding: hybrid search, incremental builds, better relevance scores, source-vs-test prioritisation. It already cuts through a lot of noise grep subjects you too.

The pencilled roadmap is Agents → Knowledge Base → Advanced memory → Dream Machines…

#RAG #KnowledgeGraph #LocalFirst #AgenticMemory #TokenEfficiency #AI

sayzard 12h ago

Github Awesome (@GithubAwesome)

AI 에이전트용 코드 검색 도구 Semble을 소개. 전체 레포를 263ms에 인덱싱하고 1.5ms에 질의 응답하며, GPU나 API 키 없이 CPU만으로 동작한다. 1.37억 파라미터 트랜스포머 모델 대비 99% 수준의 검색 품질을 주장해, 에이전트의 코드베이스 탐색·RAG 워크플로에 실용성이 높아 보인다.

https://x.com/GithubAwesome/status/2056194964464304591

#codesearch #agents #retrieval #cpu #rag

Github Awesome (@GithubAwesome) on X

Semble is code search built for AI agents, and the speed numbers are hard to ignore. It indexes a full repo in 263 milliseconds and answers queries in 1.5 milliseconds, all on CPU, no GPU, no API keys. Retrieval quality sits at 99% of a 137M-parameter transformer model. Run it as

X (formerly Twitter)