Mastodawn

Бенчмарк 7 эмбеддингов и 4 реранкеров на корпусе судебной практики

Привет, Хабр. Это мой первый пост здесь, поэтому пара слов о себе. Я практикующий юрист, 8+ лет практики, последние годы - в производственном секторе. Веду договорную работу (поставка, подряд, услуги), сопровождаю сделки, закрываю претензионку и представляю компанию в арбитражных судах и спорах по защите прав потребителей - на стороне производителя и поставщика. К коду пришёл через вайбкодинг: захотелось автоматизировать некоторые процессы, начал ковыряться в VS Code, Trae, Cursor и Claude Code, втянулся - и теперь это параллельное хобби рядом с основной практикой. Последние несколько месяцев пилю IP Agent - телеграм-бота, который по запросу находит релевантную судебную практику и даёт прогноз по размеру компенсации в делах об интеллектуальной собственности. Работает на RAG-пайплайне. Когда строишь поиск по узкому домену, рано или поздно встаёт вопрос: какой эмбеддинг брать и нужен ли вообще реранкер. Готовых ответов под русскую судебную практику я не нашёл, поэтому собрал свой бенчмарк. В посте - что меряли, как меряли, что получилось и что в итоге поставил в бота.

https://habr.com/ru/articles/1030706/

#RAG #embeddings #эмбеддинги #реранкер #reranker #nDCG #информационный_поиск #юридический_ИИ #USER2base #бенчмарк

Бенчмарк 7 эмбеддингов и 4 реранкеров на корпусе судебной практики

Хабр

Habr Mar 22

RAG: как Филин Палыч-реранкер навел порядок в цифровом королевстве

Если вы хоть раз общались с большими языковыми моделями, то знаете их главную слабость: они патологические лжецы. Они могут с абсолютной уверенностью рассказывать о вещах, которых никогда не существовало. В мире IT это называют «галлюцинациями», а лечат их с помощью RAG (Retrieval-Augmented Generation) . Если просто: это способ дать модели «шпаргалку» из ваших документов, чтобы она не гадала, а опиралась на факты. Но как эта сложная механика выглядит изнутри? Давайте разберем устройство RAG на примере одной поучительной истории из Цифрового Королевства, где один рыжий Кот чуть не довел Бизнес до нервного срыва своим враньем.

https://habr.com/ru/articles/1011992/

#RAG #LLM #Reranker #Векторный_поиск #научпоп #эмбеддинги

RAG: как Филин Палыч-реранкер навел порядок в цифровом королевстве

Утренний стендап в цифровом королевстве Используйте оглавление, если не хотите читать текст полностью: Введение ➽ О чём эта сказка — (RAG: что это и зачем) Часть 1. Как устроен базовый RAG...

Хабр

Reddit Tech VN Bot Jan 8

Qwen đã ra mắt bộ sưu tập Qwen3-VL-Reranker. Đây là mô hình Vision-Language giúp nâng cao độ chính xác cho việc tìm kiếm và truy vấn dựa trên cả hình ảnh và văn bản. #AI #Qwen #AIĐaPhươngThức #VisionLanguage #Reranker

https://www.reddit.com/r/LocalLLaMA/comments/1q7dlkn/qwen3vlreranker_a_qwen_collection/

Reddit Tech VN Bot Nov 19, 2025

Ra mắt mô hình xếp hạng đa ngôn ngữ mới zerank-2 với khả năng thực hiện theo hướng dẫn phức tạp và cung cấp độ tin cậy cao. Giá cả cạnh tranh, chỉ 0.025$/1M tokens, thấp hơn 50% so với các mô hình khác. #AI #TríTuệNhânTạo #ĐaNgônNgữ #XếpHạng #Reranker #ZeroEntropy #Multilingual #InstructionFollowing

https://www.reddit.com/r/LocalLLaMA/comments/1p1iequ/new_multilingual_instructionfollowing_reranker/

Rost Glukhov Jun 14, 2025

Qwen3 Embedding & Reranker Models on Ollama: State-of-the-Art Performance
https://www.glukhov.org/post/2025/06/qwen3-embedding-qwen3-reranker-on-ollama/
#Qwen3 #Embedding #Reranker #LLM #AI #ollama

Qwen3 Embedding & Reranker Models on Ollama: State-of-the-Art Performance - Rost Glukhov | Personal site and technical blog

Discover how Qwen3 embedding and reranker models are revolutionizing multilingual NLP with state-of-the-art performance, and explore their potential integration with Ollama for local deployment via Hugging Face and GitHub

Alessio Pomaro Aug 30, 2024

🧠 Jina.ai, oltre ad aver sviluppato un ottimo (e velocissimo) scraper di cui ho già parlato recentemente, ha altri strumenti davvero interessanti, come #Embeddings e #Reranker.
👉 Embeddings: un modello che permette di gestire i vettori di testo e immagini, consentendo un recupero delle informazioni testo-immagini.
👉 Reranker: un sistema che permette di migliorare l'accuratezza delle architetture #RAG, andando ad analizzare i risultati considerando sfumature linguistiche più raffinate.

#AI