Бенчмарк 7 эмбеддингов и 4 реранкеров на корпусе судебной практики

Привет, Хабр. Это мой первый пост здесь, поэтому пара слов о себе. Я практикующий юрист, 8+ лет практики, последние годы - в производственном секторе. Веду договорную работу (поставка, подряд, услуги), сопровождаю сделки, закрываю претензионку и представляю компанию в арбитражных судах и спорах по защите прав потребителей - на стороне производителя и поставщика. К коду пришёл через вайбкодинг: захотелось автоматизировать некоторые процессы, начал ковыряться в VS Code, Trae, Cursor и Claude Code, втянулся - и теперь это параллельное хобби рядом с основной практикой. Последние несколько месяцев пилю IP Agent - телеграм-бота, который по запросу находит релевантную судебную практику и даёт прогноз по размеру компенсации в делах об интеллектуальной собственности. Работает на RAG-пайплайне. Когда строишь поиск по узкому домену, рано или поздно встаёт вопрос: какой эмбеддинг брать и нужен ли вообще реранкер. Готовых ответов под русскую судебную практику я не нашёл, поэтому собрал свой бенчмарк. В посте - что меряли, как меряли, что получилось и что в итоге поставил в бота.

https://habr.com/ru/articles/1030706/

#RAG #embeddings #эмбеддинги #реранкер #reranker #nDCG #информационный_поиск #юридический_ИИ #USER2base #бенчмарк

Бенчмарк 7 эмбеддингов и 4 реранкеров на корпусе судебной практики

Привет, Хабр. Это мой первый пост здесь, поэтому пара слов о себе. Я практикующий юрист, 8+ лет практики, последние годы - в производственном секторе. Веду договорную работу (поставка, подряд,...

Хабр

RAG: как Филин Палыч-реранкер навел порядок в цифровом королевстве

Если вы хоть раз общались с большими языковыми моделями, то знаете их главную слабость: они патологические лжецы. Они могут с абсолютной уверенностью рассказывать о вещах, которых никогда не существовало. В мире IT это называют «галлюцинациями», а лечат их с помощью RAG (Retrieval-Augmented Generation) . Если просто: это способ дать модели «шпаргалку» из ваших документов, чтобы она не гадала, а опиралась на факты. Но как эта сложная механика выглядит изнутри? Давайте разберем устройство RAG на примере одной поучительной истории из Цифрового Королевства, где один рыжий Кот чуть не довел Бизнес до нервного срыва своим враньем.

https://habr.com/ru/articles/1011992/

#RAG #LLM #Reranker #Векторный_поиск #научпоп #эмбеддинги

RAG: как Филин Палыч-реранкер навел порядок в цифровом королевстве

Утренний стендап в цифровом королевстве Используйте оглавление, если не хотите читать текст полностью: Введение ➽ О чём эта сказка  —  (RAG: что это и зачем) Часть 1. Как устроен базовый RAG...

Хабр

Adina Yakup (@AdinaYakup)

Alibaba의 Qwen이 Hugging Face에 Qwen3‑VL‑Embedding과 Qwen3‑VL‑Reranker 두 모델 시리즈를 공개했습니다. 2B/8B 크기, Apache-2.0 라이선스이며 30개 이상 언어를 지원하고 텍스트·이미지·스크린샷·비디오 등 임의의 멀티모달 조합을 처리합니다. Qwen3‑VL‑Embedding은 유연한 벡터 기능을 제공합니다.

https://x.com/AdinaYakup/status/2009299603795922968

#qwen #multimodal #embeddings #reranker #huggingface

Adina Yakup (@AdinaYakup) on X

Qwen @Alibaba_Qwen just released two new model series: Qwen3-VL-Embedding & Qwen3-VL-Reranker on @huggingface 🚀 ✨ 2B / 8B - Apache2.0 ✨ 30+ languages ✨ Supported text, images, screenshots, videos, and arbitrary multimodal combinations Qwen3-VL-Embedding: Flexible vector

X (formerly Twitter)

Qwen đã ra mắt bộ sưu tập Qwen3-VL-Reranker. Đây là mô hình Vision-Language giúp nâng cao độ chính xác cho việc tìm kiếm và truy vấn dựa trên cả hình ảnh và văn bản. #AI #Qwen #AIĐaPhươngThức #VisionLanguage #Reranker

https://www.reddit.com/r/LocalLLaMA/comments/1q7dlkn/qwen3vlreranker_a_qwen_collection/

Ra mắt mô hình xếp hạng đa ngôn ngữ mới zerank-2 với khả năng thực hiện theo hướng dẫn phức tạp và cung cấp độ tin cậy cao. Giá cả cạnh tranh, chỉ 0.025$/1M tokens, thấp hơn 50% so với các mô hình khác. #AI #TríTuệNhânTạo #ĐaNgônNgữ #XếpHạng #Reranker #ZeroEntropy #Multilingual #InstructionFollowing

https://www.reddit.com/r/LocalLLaMA/comments/1p1iequ/new_multilingual_instructionfollowing_reranker/

Qwen3 Embedding & Reranker Models on Ollama: State-of-the-Art Performance
https://www.glukhov.org/post/2025/06/qwen3-embedding-qwen3-reranker-on-ollama/
#Qwen3 #Embedding #Reranker #LLM #AI #ollama
Qwen3 Embedding & Reranker Models on Ollama: State-of-the-Art Performance - Rost Glukhov | Personal site and technical blog

Discover how Qwen3 embedding and reranker models are revolutionizing multilingual NLP with state-of-the-art performance, and explore their potential integration with Ollama for local deployment via Hugging Face and GitHub

🧠 Jina.ai, oltre ad aver sviluppato un ottimo (e velocissimo) scraper di cui ho già parlato recentemente, ha altri strumenti davvero interessanti, come #Embeddings e #Reranker.
👉 Embeddings: un modello che permette di gestire i vettori di testo e immagini, consentendo un recupero delle informazioni testo-immagini.
👉 Reranker: un sistema che permette di migliorare l'accuratezza delle architetture #RAG, andando ad analizzare i risultati considerando sfumature linguistiche più raffinate.

#AI