Ruby로 LLM 기반 애플리케이션 구축하기: 실용적인 소개
Ruby는 이제 LLM 기반 애플리케이션 개발을 위한 완전한 역량을 갖추고 있으며, Python 없이도 AI 시스템 구축이 가능합니다.
Ruby로 LLM 기반 애플리케이션 구축하기: 실용적인 소개
Ruby는 이제 LLM 기반 애플리케이션 개발을 위한 완전한 역량을 갖추고 있으며, Python 없이도 AI 시스템 구축이 가능합니다.
헬스케어 제품을 위한 LLM 선택 및 구현 가이드
헬스케어 분야의 LLM 도입은 단순한 성능 비교를 넘어 데이터 보안, 규제 준수, 비용 관리 및 환자 안전을 최우선으로 고려하는 전략적 접근이 필수적입니다.
Почему RAG — фундамент любой AI-трансформации
За последние годы большинство AI-проектов в компаниях стартуют одинаково: сначала делают чат-бота, затем добавляют агентов, автоматизируют отдельные процессы и ожидают роста эффективности. На практике такие проекты часто не дают устойчивого результата. Модель может корректно генерировать текст, демонстрации выглядят убедительно, но в реальной работе ответы оказываются нестабильными, противоречивыми и не связанными с внутренними стандартами компании. Основная причина — отсутствие единого слоя знаний. В проекте для ресторанной группы с 10+ заведениями и историей более 15 лет мы сознательно начали не с агентов и не с интерфейсов, а с построения корпоративной RAG-инфраструктуры. Этот слой стал основой всей последующей AI-архитектуры.
https://habr.com/ru/articles/1039986/
#rag #искусственный_интеллект #llm #retrieval_augmented_generation #векторная_база_данных #embeddings #корпоративные_данные #ai_automation #knowledge_base #hallucinations
RAG в enterprise: 70-80% проблем не в модели, а в данных
Эта статья родилась из работы над
https://habr.com/ru/companies/alpinadigital/articles/1036196/
#RAG #enterprise_AI #retrieval_augmented_generation #embeddings #GraphRAG #Agentic_RAG #BM25 #chunking #LLM #AlpinaGPT
10 актуальных RAG-подходов: какие реально полезны и когда их применять?
Всем привет, на фоне обновлений в LLM-стеке за последний год, решил собрать практический список RAG-подходов, которые реально используются в продакшене на основе моего опыта и того что я изучал в других кейсах.
https://habr.com/ru/articles/1029616/
#aiразработка #rag_ai #rag_pipeline #retrieval_augmented_generation #llm #llmмодели #vector_search #hybrid_search #graphrag #multimodal
Книга: «Основы GraphRAG. Улучшенный RAG на базе графов знаний»
Привет, Хабожители! Создайте и разверните систему GraphRAG производственного уровня. Научитесь извлекать структурированные знания из текста и комбинировать методы векторного поиска с поиском по графам. Книга богата практическими примерами: от создания инструмента поиска по векторному сходству и приложения Agentic RAG до оценки эффективности и точности результатов работы такого приложения.
Как помочь вашему RAG адаптироваться? Принимайте DRAG with KNEE! Часть 1
Все мы проходили через это: скармливаешь RAG‑системе сложный PDF на 50 страниц, а она в ответ либо галлюцинирует, либо вываливает на LLM простыню нерелевантного текста, съедая ваш бюджет на токены быстрее, чем вы успеваете сказать «GPT-4o». Проблема в том, что классический подход со статическим top_k — это костыль, который либо не додает контекста, либо вызывает у модели информационное «ожирение» (заполняет контекст нерелевантным мусором). Нашему RAG нужно помочь адаптироваться к безжалостной среде разрозненных документов! Я потратил выходные на то, чтобы решить эту проблему фундаментально. В итоге на свет появился DRAG with KNEE (Dynamic RAG with Knee‑point pruning) — алгоритм, который не просто ищет «похожее», а выстраивает иерархию документов и безжалостно отсекает лишнее с помощью геометрического анализа «колена». В этой статье я покажу, как с помощью Qdrant, Python и капли математики сделать ваш RAG адаптивным. Читать далее?
https://habr.com/ru/articles/1016438/
#rag #knee #hierarchical_structure #optimization #retrieval_augmented_generation
От 0.034 до 0.791 и обратно: Legal RAG, 17 итераций и стена масштабирования
Я участвовал в ARLC 2026 — юридическом AI-челлендже по построению RAG-пайплайна поверх корпуса судебных решений и законов. Соло, с Claude Code в качестве напарника. За 5 дней и 17 итераций прошёл путь от 0.034 до 0.791 на warmup — а потом вышел в финал и потерял 42% на 300 документах вместо 30. Внутри — архитектура, код, математика F-beta, три провала и честный разбор работы с AI-ассистентом.
https://habr.com/ru/articles/1014758/
#RAG #retrieval_augmented_generation #legal_AI #Claude #grounding #BM25 #reranking #NLP #соревнование
Generative AI for Beginners .NET: Version 2 on .NET 10
https://devblogs.microsoft.com/dotnet/generative-ai-for-beginners-dotnet-version-2-on-dotnet-10/
#microsoft #NET #NET_Aspire #NET_Fundamentals #AI #C #Cloud #NET_10 #agent_framework #ai_course #generative_ai #Microsoft_Extensions_AI #retrieval_augmented_generation
Announcement of Version 2 of Generative AI for Beginners .NET, a free course rebuilt for .NET 10 with Microsoft.Extensions.AI, updated RAG patterns, and new agent framework content across five structured lessons for building production-ready AI apps.
RAG на PHP + Qdrant: быстрый MVP для внутренней базы знаний
RAG на PHP - звучит непривычно. Делюсь опытом построения чат-бота для поиска по внутренней базе документов: Symfony, Qdrant с гибридным поиском, YandexGPT для embedding и генерации ответов. Внутри — готовый код, подводные камни чанкинга и советы, которые сэкономят вам время.
https://habr.com/ru/articles/1001156/
#rag #retrieval_augmented_generation #llm #qdrant #yandexgpt #php #rag_pipeline #neuron