От 0.034 до 0.791 и обратно: Legal RAG, 17 итераций и стена масштабирования

Я участвовал в ARLC 2026 — юридическом AI-челлендже по построению RAG-пайплайна поверх корпуса судебных решений и законов. Соло, с Claude Code в качестве напарника. За 5 дней и 17 итераций прошёл путь от 0.034 до 0.791 на warmup — а потом вышел в финал и потерял 42% на 300 документах вместо 30. Внутри — архитектура, код, математика F-beta, три провала и честный разбор работы с AI-ассистентом.

https://habr.com/ru/articles/1014758/

#RAG #retrieval_augmented_generation #legal_AI #Claude #grounding #BM25 #reranking #NLP #соревнование

От 0.034 до 0.791 и обратно: Legal RAG, 17 итераций и стена масштабирования

От 0.034 до 0.791 и обратно: соревнование по Legal RAG, 17 итераций и стена масштабирования Мне давно хотелось погрузиться в RAG, но повода не было. Я решил поучаствовать в ARLC 2026 — юридическом...

Хабр

Стоит ли обжаловать решение суда? Битва AI-титанов в 2026 году

Недавно на рынке произошло мощное обновление всей "большой тройки" LLM. Я решил провести исследование и сравнить самые свежие версии моделей от Anthropic, OpenAI и Google, чтобы понять, кто из них лучше всего справляется с ролью "LLM as Real Judge". Причем только в части оценки шансов в апелляции.

https://habr.com/ru/articles/1002088/

#искусственный_интеллект #legaltech #legal_ai #legaltech

Стоит ли обжаловать решение суда? Битва AI-титанов в 2026 году

Как разработчик постоянно ищу способы улучшить качество прогнозов своего сервиса, который анализирует судебные документы (иски, решения судов), и выдаёт прогноз исхода. А с недавних пор производит...

Хабр
60% of Legal Searches Now End Without a Click. Here's What That Means for Your Firm.

AI Overviews are answering legal questions before users reach your website. Traffic is down 19%, CPCs are up 568%, and the old playbook is breaking.

Почему «голая» GPT не тянет юриспруденцию: разбираем архитектуру китайской LabourLawLLM

Любой, кто пытался прикрутить LLM к реальному продакшену в узком домене (медицина, право, инженерия), проходил стадию отрицания: "Да ладно, сейчас промпт подкручу, RAG прикручу — и полетит". Не полетит. 🙂 На этой неделе (январь 2026 г.) вышел любопытный китайский препринт "Chinese Labor Law Large Language Model Benchmark". Авторы сделали то, до чего у большинства стартапов не доходят руки: вместо написания очередной обертки над OpenAI API, они построили жесткий бенчмарк и доказали, что General-purpose модели сливают специализированным SFT-моделям, как только дело доходит до специфической логики и расчетов. Ниже — разбор статьи с проекцией на мой опыт разработки neshemyaka.ru (Legal AI для оценки исков). Спойлер: китайцы математически подтвердили то, что пришлось выяснять через боль и сжигание токенов. Суть проблемы: Generalist vs Specialist Основная гипотеза авторов: большие модели страдают от «размытия» контекста. Когда модель знает всё обо всём, она начинает галлюцинировать в задачах, требующих строгой импликации (если А, то Б, но только при условии В). Для проверки они собрали LabourLawBench — датасет из 12 типов задач по трудовому праву. И это не просто «вопрос-ответ». Архитектура бенчмарка (можно сказать, feature map для разработчика) Если вы пилите LegalTech, забирайте этот список как готовое ТЗ. Авторы выделили 12 задач:

https://habr.com/ru/articles/986120/

#legaltech #ai #ии #машинное+обучение #искусственный_интеллект #legal_ai #legaltech

Почему «голая» GPT не тянет юриспруденцию: разбираем архитектуру китайской LabourLawLLM

Любой, кто пытался прикрутить LLM к реальному продакшену в узком домене (медицина, право, инженерия), проходил стадию отрицания: "Да ладно, сейчас промпт подкручу, RAG прикручу — и полетит". Не...

Хабр

Как юристу надоело объяснять, что дело швах: рождение «неШемяки!»

AI Legal веб-сервис для тех, кто устал гадать «Шемякин суд» — это не просто избитый фразеологизм, но реальность для многих, кто ввязался в судебную тяжбу, не оценив заранее все риски. Тысячи проигранных дел, потраченные нервы и деньги — всего этого можно было бы избежать, задай истец себе вовремя один простой вопрос: «Каковы мои шансы?». “неШемяка!” — это маленькое веб‑приложение, которое пытается ответить на один простой вопрос, есть ли хоть малейший смысл подавать иск, это сервис, который пытается отличить перспективное дело от заранее проигрышного. Эта статья — немного про архитектуру сервиса, но, в первую очередь, про путь: от разработчика до выпускника юрфака МГУ, который через десять лет успешной судебной практики вернулся обратно в код. И который, случись тут недельный отпуск, решил автоматизировать рутину первичной оценки исков. От разработки к юрфаку, или туда и обратно До юрфака была разнообразная, в том числе и айтишная биография: были и код, и проекты, и продакшн…. Потом случился юридический факультет МГУ, и написание кода сменилось на написание исков, жалоб, возражений - десять лет полноценного litigation. Так бывает, что захотелось в ту же реку войти дважды - и неожиданно для себя оказался опять в разработке: никто же не обещал, что род занятий нужно выбирать один раз и навсегда.🙂 При этом живая судебная практика дает редкий для разработчика навык — быстрое погружение в предметную область. Приходит клиент, и за несколько часов нужно разобраться в контексте, помочь принять важное решение, а, иногда, на следующий день оказаться в судебном процессе. Так что возвращение в it было веселым и закончилось solution архитектурой и в-свое-удовольствие бэкендом.

https://habr.com/ru/articles/968438/

#legal_ai #legal_tech #ииассистент #искусственный_интеллект #юриспруденция_в_it #ии_для_юристов

Как юристу надоело объяснять, что дело швах: рождение «неШемяки!»

AI Legal веб-сервис для тех, кто устал гадать «Шемякин суд» — это не просто избитый фразеологизм, но реальность для многих, кто ввязался в судебную тяжбу, не оценив заранее все риски. Тысячи...

Хабр

#AI #Legal_Tech #Legal_AI
„25 facts about AI & Law you always wanted to know (but were afraid to ask).“
by RA Michael Grupp

https://medium.com/@Grupp/25-facts-about-ai-law-you-always-wanted-to-know-but-were-afraid-to-ask-a43fd9568d6d

25 facts about AI & Law you always wanted to know (but were afraid to ask).

In law, everybody is talking about AI. Most of it is slightly or utterly incorrect. Discoveries in recent years have little impact on the…