Контекст — не инфраструктура: почему большое окно не заменяет retrieval-слой

Зачем строить RAG или retrieval-слой, если современные модели уже умеют работать с огромным контекстом?

https://habr.com/ru/articles/1042454/

#rag #retrieva #llm #база_знаний #knowledge_base #agents

Контекст — не инфраструктура: почему большое окно не заменяет retrieval-слой

Недавно в одном инженерном обсуждении я снова услышал аргумент, который в последнее время звучит всё чаще: Зачем строить RAG или retrieval-слой, если современные модели уже умеют работать с огромным...

Хабр

دليل IBM الجديد "RAG Cookbook" يشرح كيف نبني أنظمة استرجاع معتمد على نماذج اللغة الكبيرة.

🔹 **مفتاح النجاح:** دمج محرك بحث محلي مع نموذج LLM يرفع دقة النتائج ويقلل زمن الاستجابة، مع الحفاظ على سرية البيانات.

🔹 مثال عملي: تخزين embeddings محليًا ثم طلب توليد إجابات من نموذج AI فقط عند الحاجة.

#AI #RAG #DataPrivacy #OpenSource #Fediverse

🔗 https://news.google.com/rss/articles/CBMidEFVX3lxTFBDVVZMQm40Q1dQdThiY0ZlR0ozUEsxX01TWmhJcGNhTW9PRFFzcE1oSUJuLUQtaVc0YldfLU5fYUxDMEhYLVI2YUt0cUNycmNSUjJmU1BPUG9FU0JhN2IxaHJ1NWNwVEdJZE4xQnNjQUw1ZXpp?oc=5

Before you continue

"Reading Between the Citations: A Typed Claim Network for Scientific Literature"

We propose the claim network: a representational pattern in which each cross-document reference is reified as a typed claim, carrying source, target, claim text, and a four-class stance label grounded in the citation-intent literature. This is a way of improving the performance of RAG systems.

https://arxiv.org/pdf/2605.30966

#research #AI #RAG

The current Retrieval-Augmented Generation (RAG) design hides a critical issue: many systems are silently failing. https://hackernoon.com/your-rag-system-is-probably-broken-heres-how-to-fix-it #rag
Your RAG System Is Probably Broken (Here’s How to Fix It) | HackerNoon

The current Retrieval-Augmented Generation (RAG) design hides a critical issue: many systems are silently failing.

축적된 Ruby 지식을 로컬 코딩 어시스턴트로 전환하는 방법

범용 LLM은 Ruby의 일반적인 문법을 잘 알고 있지만, 특정 프로젝트의 관습이나 내부 라이브러리, 비공개 코드베이스에 대한 맥락이 부족하다는 한계가 있다.

🔗 원문 보기

This article explores how chunking strategies affect RAG performance, retrieval quality, and context preservation across modern AI systems. https://hackernoon.com/what-two-years-of-research-have-taught-us-about-chunking-for-rag #rag
What Two Years of Research Have Taught Us About Chunking for RAG | HackerNoon

This article explores how chunking strategies affect RAG performance, retrieval quality, and context preservation across modern AI systems.

教育プラットフォームを Next.js 16 + Supabase Pro で本番運用している話 — 40 名同時アクセス対応 / RAG / PWA / 多テナント
https://qiita.com/TaichiEndoh/items/ea57c1a2b9d6b321279b?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items

#qiita #Next_js #rag #Vercel #Supabase #Clerk

教育プラットフォームを Next.js 16 + Supabase Pro で本番運用している話 — 40 名同時アクセス対応 / RAG / PWA / 多テナント - Qiita

3 行まとめ 学校向け教育プラットフォームを Next.js 16 + Supabase Pro + Clerk + Vercel Pro で構築し、本番運用中 40 名同時アクセス対応 ・RAG セマンティック検索 (pgvector + Gemini Embedd...

Qiita

AI для PHP-разработчиков. Часть 7: Экосистема AI-агентов в PHP – от простых вызовов OpenAI до мультиагентных платформ

За последние два года в экосистеме PHP вокруг AI-разработки сформировалась целая индустрия. Если раньше интеграция LLM выглядела как несколько строк кода с вызовом OpenAI API, то сегодня разработчики строят полноценные агентные системы: с памятью, инструментами, workflow, наблюдаемостью (observability) и даже командами специализированных агентов. Обычно, когда говорят об AI-разработке, в первую очередь говорят о Python. Тут полно интересных вещей, таких как: LangChain, LangGraph, CrewAI, AutoGen – весь основной шум долгое время происходил именно там. Но параллельно интересная история развивается и в PHP. И меня это, безусловно, очень радует. Причем если еще пару лет назад PHP-разработчику приходилось буквально собирать все вручную поверх SDK провайдеров, то сегодня уже существует полноценная экосистема инструментов разного уровня абстракции – от клиентов для работы с моделями до платформ управления многоагентными системами. Давайте посмотрим, как выглядит этот рынок сейчас.

https://habr.com/ru/articles/1041594/

#php #ииагенты #LLM #OpenAI #MultiAgent_Systems #Prism_PHP #Laravel_AI #Neuron_AI #RAG #Structured_Output

AI для PHP-разработчиков. Часть 7: Экосистема AI-агентов в PHP – от простых вызовов OpenAI до мультиагентных платформ

Это седьмая часть проекта. Часть 6:  Bag of Words и TF–IDF – как компьютер превращает текст в математику Часть 5:  От массивов к GPU: как PHP-экосистема приходит к настоящему ML Часть...

Хабр
Ich denke, #RAG-basierte #KI-Tools haben ein großes Potenzial für die #Verwaltung, z..B. als Support-Chatbot beim Thema Arbeitszeit könnten Dokumente dazu wie die Dienstvereinbarung, Arbeitszeitgesetze, Tarifvorschriften und die Anleitung zum Zeiterfassungs-Tool als Datengrundlage verwendet werden.
Der #moodle #chatbot von #moodlenrw ist schon sehr beeindruckend. Da die #ki auf vorgegebene Dateien aus einem #rag-Verzeichnis zurückgreift, lässt sich das ganze mit der kostenlosen #mistral Version auf den internen Servern von #kiconnect der Hochschulen in #nrw betreiben. Ich hab hier mal einen Moodle-Supportchat erstellt, mit Materialen, die ich in den letzten Jahren mit meinem Team erstellt habe. #fedilz #fedicampus Danke an das Projektteam aus #nrw! Sollte unbedingt weiterentwickelt werden!