Rise of RAG: от плоских векторов к темпоральным графам в юридическом домене

Привет, Хабр! Меня зовут Екатерина, я практикующий инхаус-юрист с фокусом на IT, IP и рекламе. Недавно я начала экспериментировать с технологией Retrieval-Augmented Generation и векторным поиском в юридических задачах, а также исследовать архитектурные подходы к построению баз знаний в юриспруденции. Этот материал — обзор трёх публикаций о способах построения таких баз, а также моя попытка начать формулировать методологию структурирования юридического знания для RAG. Буду признательна за любой инпут со стороны ML-специалистов.

https://habr.com/ru/articles/964202/

#RAG #эмбеддинги #графы #база_знаний #юриспруденция

Rise of RAG: от плоских векторов к темпоральным графам в юридическом домене

Развитие методов дизайна RAG-систем на описанных в статье трех подходах можно представить как добавление концептуальных «измерений», где каждое «измерение» представляет собой более сложную технологию...

Хабр

Семантический поиск на Laravel через pgvector

Привет, Хабр! Предлагаю сегодня разобраться, как семантический поиск появился в Laravel и PostgreSQL. Разобраться в деталях

https://habr.com/ru/companies/otus/articles/951678/

#postgresql #Laravel #pgvector #семантический_поиск #векторный_поиск #эмбеддинги

Семантический поиск на Laravel через pgvector

Привет, Хабр! Предлагаю сегодня разобраться, как семантический поиск появился в Laravel и PostgreSQL. Обычный полнотекстовый поиск ищет записи, содержащие конкретные слова. Но что если...

Хабр

Облачные технологии в контексте агентских AI-систем

В настоящее время процветает разработка агентов — приложений на базе Generative AI, реализующих автономные рабочие процессы . Извлечение и анализ данных, управление детерминированными программами и так далее. Массу вещей можно автоматизировать с помощью LLM и вызова функций , отсюда и спрос на такие системы. Как и традиционное ПО, агенты обычно реализуют принцип разделения логики на специализированные узлы обработки конкретных задач , например, один парсит данные по определенной инструкции, другой их анализирует, третий формирует конечный результат. Необходимость применения такого подхода диктуется не только архитектурным принципом единой ответственности , который делает систему более предсказуемой, но и ограничениями самого ИИ . При попытке выполнить несколько задач вызовом одного промпта ограничивающим фактором является механизм внимания , который лучше справляется, если его не слишком перегружать вводными данными. А при использовании разных промптов для разных задач главное ограничение — в том, на сколько доменов модель успешно генерализуется без дообучения под каждый из них .

https://habr.com/ru/articles/949650/

#ai_агенты #generative_ai #llm #reasoning #reasoning_models #эмбеддинги

Облачные технологии в контексте агентских AI-систем

В настоящее время процветает разработка агентов — приложений на базе Generative AI, реализующих автономные рабочие процессы . Извлечение и анализ данных, управление детерминированными программами и...

Хабр

[Перевод] Автоэмбеддинги: поиск на ИИ без лишней мороки

Мы рады представить новую возможность, которая делает создание приложений с семантическим поиском таким же простым, как написание SQL-запроса: Автоэмбеддинги . Теперь Manticore Search берёт на себя генерацию эмбеддингов — без дополнительных пайплайнов, внешних сервисов и лишней мороки.

https://habr.com/ru/articles/947632/

#векторный_поиск #семантический_поиск #эмбеддинги #embeddings #vector_search #semantic_search #sql_search #knnsearch #hnsw #json_api

Автоэмбеддинги: поиск на ИИ без лишней мороки

Мы рады представить новую функцию, которая делает создание приложений с семантическим поиском таким же простым, как написание SQL-запроса: Автоэмбеддинги . С этой возможностью Manticore Search берёт...

Хабр

Law & Practice Ensemble RAG. Как создать ИИ-ассистента, помогающего решать многоаспектные юридические задачи

В первой части мы кратко рассмотрели предпосылки и последствия ИИ‑трансформации деятельности юристов, а также предложили вариант архитектуры продвинутой RAG‑системы, учитывающей особенности юридической предметной области. Во этой части мы проведем обзор общих и юридических бенчмарков, которые целесообразно учитывать при оценке технических компонент RAG, а также системы в целом. В заключение рассмотрим, как самостоятельно подготовить тестовый датасет для оценки RAG‑системы с помощью фреймворка RAGAS и разберем итоговые результаты эксперимента.

https://habr.com/ru/companies/otus/articles/946354/

#RAG #retrievalaugmented_generation #LLM #Large_Language_Models #Эмбеддинги #Векторные_базы_данных #Векторные_хранилища #Индексация #Ранжирование

Law & Practice Ensemble RAG. Как создать ИИ-ассистента, помогающего решать многоаспектные юридические задачи

Автор статьи: Сергей Слепухин В первой части мы кратко рассмотрели предпосылки и последствия ИИ‑трансформации деятельности юристов, а также предложили вариант архитектуры продвинутой...

Хабр

Law & Practice Ensemble RAG. Как создать ассистента, помогающего решать многоаспектные юридические задачи

Большие языковые модели ( LLM ) в последние несколько лет являются ключевым направлением искусственного интеллекта. Дальнейшее развитие LLM, очевидно, меняет сам способ взаимодействия с технологиями , снижая порог входа для представителей всех профессий, в том числе исконно гуманитарных.

https://habr.com/ru/companies/otus/articles/946012/

#RAG #RetrievalAugmented_Generation #llm #Large_Language_Models #языковые_модели #трансформеры #finetuning #эмбеддинги #dense_retrieval

Law & Practice Ensemble RAG. Как создать ассистента, помогающего решать многоаспектные юридические задачи

Автор статьи: Сергей Слепухин Большие языковые модели ( LLM ) в последние несколько лет являются ключевым направлением искусственного интеллекта (ИИ). Дальнейшее развитие LLM, очевидно, меняет...

Хабр

Цифровой профиль в ВТБ: как графы и эмбеддинги помогают банку понимать клиентов

Статья рассказывает о том, как банк строит единый цифровой профиль клиента, используя графы и эмбеддинги. Вы узнаете, как разрозненные данные о транзакциях, связях и балансах превращаются в мощный инструмент для анализа и прогнозирования. Разберем, почему классических табличных подходов недостаточно и как графы помогают выявлять скрытые связи между клиентами, как клиенты «превращаются в слова» и на чем измеряется успех. Статья будет полезна data scientist’ам, ML-инженерам и всем, кто интересуется практическим применением графовых методов и машинного обучения в крупном бизнесе.

https://habr.com/ru/companies/vtb/articles/944338/

#эмбеддинги #цифровой_профиль

Цифровой профиль в ВТБ: как графы и эмбеддинги помогают банку понимать клиентов

Всем привет! Я Иван Яруков, Data Scientist в команде NLP/OCR моделирования КИБ и СМБ ВТБ . Сегодня банк превращается из просто финансового института в технологическую экосистему, способную...

Хабр

Строим корпоративную GenAI-платформу: от концепции до ROI. Часть 3. Retrieval-Augmented Generation (RAG) на службе GenAI

Это третья статья специалиста по архитектуре ИТ-систем и трансформации ИТ-ландшафта Дениса Прилепского из серии «Строим корпоративную GenAI-платформу: от концепции до ROI». Автор разбирает, что такое RAG и зачем он нужен, как устроена архитектура retrieval-уровня и почему он критически важен для достоверных ответов. В статье — пример генерации юридической справки, практические проблемы (задержки, кеширование, актуальность) и подготовка к следующей теме — guardrails.

https://habr.com/ru/companies/mipt_digital/articles/932962/

#RAG #retrieval #векторные_базы_данных #эмбеддинги #LLM #корпоративные_ассистенты #кеширование #генерация_с_контекстом

Строим корпоративную GenAI-платформу: от концепции до ROI. Часть 3. Retrieval-Augmented Generation (RAG) на службе GenAI

В предыдущих статьях серии ( Часть 1 , Часть 2 ) мы обсудили концепцию корпоративной GenAI-платформы и подходы к ее разработке. Теперь перейдем к одному из ключевых компонентов такой платформы —...

Хабр

Путешествие одного промпта: Что на самом деле происходит под капотом у LLM?

Загадка работы LLM: что происходит, когда вы нажимаете Enter? Разбираем пошагово путь вашего промпта от токенизации до генерации ответа. Узнайте, как устроены большие языковые модели, как ими управлять и какие мифы они развеивают.

https://habr.com/ru/articles/931844/

#llm #промпт #трансформеры #токенизация #эмбеддинги #механизм_внимания #генеративный_ии #Как_работает_ИИ

Путешествие одного промпта: Что на самом деле происходит под капотом у LLM?

Мы все там были. Пустой курсор мигает на экране, в голове крутится сложный вопрос, и вы обращаетесь к своему цифровому оракулу — большой языковой модели. Представьте, вы пишете в чат что-то вроде:...

Хабр

Автоматизация поддержки клиентов на основе контекстной близости вопросов

Кейсовая задача - предоставить клиентам возможность составлять вопрос на естественном языке, а не искать вопрос в списке FAQ-раздела сайта. При этом система должна выдавать ответ из существующей базы знаний "Вопрос-Ответ" существующего FAQ-раздела. Задача реализована с помощью определения контекстной близости вопросов. Получился довольно экономичный и эффективный способ автоматизации поддержки клиентов, позволяющий обеспечивать релевантные и быстрые ответы.

https://habr.com/ru/articles/922726/

#программирование #python #искусственный_интеллект #искусственные_нейронные_сети #векторные_представления #эмбеддинги #embeddings #обработка_естественного_языка #поддержка_клиентов #поддержка_пользователей

Автоматизация поддержки клиентов на основе контекстной близости вопросов

Привет, Хабр! Меня зовут Анатолий, занимаюсь диалоговыми системами и применением Искусственного Интеллекта в бизнесе. Кейсовая задача - предоставить клиентам возможность составлять вопрос на...

Хабр