Ruby로 LLM 기반 애플리케이션 구축하기: 실용적인 소개

Ruby는 이제 LLM 기반 애플리케이션 개발을 위한 완전한 역량을 갖추고 있으며, Python 없이도 AI 시스템 구축이 가능합니다.

🔗 원문 보기

Ruby로 LLM 기반 애플리케이션 구축하기: 실용적인 소개

Ruby는 이제 LLM 기반 애플리케이션 개발을 위한 완전한 역량을 갖추고 있으며, Python 없이도 AI 시스템 구축이 가능합니다.

Ruby-News

헬스케어 제품을 위한 LLM 선택 및 구현 가이드

헬스케어 분야의 LLM 도입은 단순한 성능 비교를 넘어 데이터 보안, 규제 준수, 비용 관리 및 환자 안전을 최우선으로 고려하는 전략적 접근이 필수적입니다.

🔗 원문 보기

헬스케어 제품을 위한 LLM 선택 및 구현 가이드

헬스케어 분야의 LLM 도입은 단순한 성능 비교를 넘어 데이터 보안, 규제 준수, 비용 관리 및 환자 안전을 최우선으로 고려하는 전략적 접근이 필수적입니다.

Ruby-News

Почему RAG — фундамент любой AI-трансформации

За последние годы большинство AI-проектов в компаниях стартуют одинаково: сначала делают чат-бота, затем добавляют агентов, автоматизируют отдельные процессы и ожидают роста эффективности. На практике такие проекты часто не дают устойчивого результата. Модель может корректно генерировать текст, демонстрации выглядят убедительно, но в реальной работе ответы оказываются нестабильными, противоречивыми и не связанными с внутренними стандартами компании. Основная причина — отсутствие единого слоя знаний. В проекте для ресторанной группы с 10+ заведениями и историей более 15 лет мы сознательно начали не с агентов и не с интерфейсов, а с построения корпоративной RAG-инфраструктуры. Этот слой стал основой всей последующей AI-архитектуры.

https://habr.com/ru/articles/1039986/

#rag #искусственный_интеллект #llm #retrieval_augmented_generation #векторная_база_данных #embeddings #корпоративные_данные #ai_automation #knowledge_base #hallucinations

Почему RAG — фундамент любой AI-трансформации

За последние годы большинство AI-проектов в компаниях стартуют одинаково: сначала делают чат-бота, затем добавляют агентов, автоматизируют отдельные процессы и ожидают роста эффективности. На практике...

Хабр

RAG в enterprise: 70-80% проблем не в модели, а в данных

Эта статья родилась из работы над

https://habr.com/ru/companies/alpinadigital/articles/1036196/

#RAG #enterprise_AI #retrieval_augmented_generation #embeddings #GraphRAG #Agentic_RAG #BM25 #chunking #LLM #AlpinaGPT

RAG в enterprise: 70-80% проблем не в модели, а в данных

Жемал Хамидун, Head of AI Alpina Digital , CPO AlpinaGPT , автор тг-канала «Готовим ИИшницу» . Эта статья родилась из работы над AlpinaGPT . Мы недавно зарелизили в нём по-настоящему крутых...

Хабр

10 актуальных RAG-подходов: какие реально полезны и когда их применять?

Всем привет, на фоне обновлений в LLM-стеке за последний год, решил собрать практический список RAG-подходов, которые реально используются в продакшене на основе моего опыта и того что я изучал в других кейсах.

https://habr.com/ru/articles/1029616/

#aiразработка #rag_ai #rag_pipeline #retrieval_augmented_generation #llm #llmмодели #vector_search #hybrid_search #graphrag #multimodal

10 актуальных RAG-подходов: какие реально полезны и когда их применять?

Всем привет, на фоне обновлений в LLM-стеке за последний год, решил собрать практический список RAG-подходов, которые реально используются в продакшене на основе моего опыта и того что я изучал в...

Хабр

Книга: «Основы GraphRAG. Улучшенный RAG на базе графов знаний»

Привет, Хабожители! Создайте и разверните систему GraphRAG производственного уровня. Научитесь извлекать структурированные знания из текста и комбинировать методы векторного поиска с поиском по графам. Книга богата практическими примерами: от создания инструмента поиска по векторному сходству и приложения Agentic RAG до оценки эффективности и точности результатов работы такого приложения.

https://habr.com/ru/companies/piter/articles/1013810/

#rag_ai #retrieval_augmented_generation #llm #graphrag

Книга: «Основы GraphRAG. Улучшенный RAG на базе графов знаний»

Привет, Хабожители! Система генерации ответа, дополненная результатами поиска (Retrieval Augmented Generation, RAG), автоматически выбирает и предоставляет контекст, характерный для конкретной...

Хабр

Как помочь вашему RAG адаптироваться? Принимайте DRAG with KNEE! Часть 1

Все мы проходили через это: скармливаешь RAG‑системе сложный PDF на 50 страниц, а она в ответ либо галлюцинирует, либо вываливает на LLM простыню нерелевантного текста, съедая ваш бюджет на токены быстрее, чем вы успеваете сказать «GPT-4o». Проблема в том, что классический подход со статическим top_k — это костыль, который либо не додает контекста, либо вызывает у модели информационное «ожирение» (заполняет контекст нерелевантным мусором). Нашему RAG нужно помочь адаптироваться к безжалостной среде разрозненных документов! Я потратил выходные на то, чтобы решить эту проблему фундаментально. В итоге на свет появился DRAG with KNEE (Dynamic RAG with Knee‑point pruning) — алгоритм, который не просто ищет «похожее», а выстраивает иерархию документов и безжалостно отсекает лишнее с помощью геометрического анализа «колена». В этой статье я покажу, как с помощью Qdrant, Python и капли математики сделать ваш RAG адаптивным. Читать далее?

https://habr.com/ru/articles/1016438/

#rag #knee #hierarchical_structure #optimization #retrieval_augmented_generation

Как помочь вашему RAG адаптироваться? Принимайте DRAG with KNEE! Часть 1

Все мы проходили через это: скармливаешь RAG‑системе сложный PDF на 50 страниц, а она в ответ либо галлюцинирует, либо вываливает на LLM простыню нерелевантного текста,...

Хабр

От 0.034 до 0.791 и обратно: Legal RAG, 17 итераций и стена масштабирования

Я участвовал в ARLC 2026 — юридическом AI-челлендже по построению RAG-пайплайна поверх корпуса судебных решений и законов. Соло, с Claude Code в качестве напарника. За 5 дней и 17 итераций прошёл путь от 0.034 до 0.791 на warmup — а потом вышел в финал и потерял 42% на 300 документах вместо 30. Внутри — архитектура, код, математика F-beta, три провала и честный разбор работы с AI-ассистентом.

https://habr.com/ru/articles/1014758/

#RAG #retrieval_augmented_generation #legal_AI #Claude #grounding #BM25 #reranking #NLP #соревнование

От 0.034 до 0.791 и обратно: Legal RAG, 17 итераций и стена масштабирования

От 0.034 до 0.791 и обратно: соревнование по Legal RAG, 17 итераций и стена масштабирования Мне давно хотелось погрузиться в RAG, но повода не было. Я решил поучаствовать в ARLC 2026 — юридическом...

Хабр
Generative AI for Beginners .NET: Version 2 on .NET 10 - .NET Blog

Announcement of Version 2 of Generative AI for Beginners .NET, a free course rebuilt for .NET 10 with Microsoft.Extensions.AI, updated RAG patterns, and new agent framework content across five structured lessons for building production-ready AI apps.

.NET Blog

RAG на PHP + Qdrant: быстрый MVP для внутренней базы знаний

RAG на PHP - звучит непривычно. Делюсь опытом построения чат-бота для поиска по внутренней базе документов: Symfony, Qdrant с гибридным поиском, YandexGPT для embedding и генерации ответов. Внутри — готовый код, подводные камни чанкинга и советы, которые сэкономят вам время.

https://habr.com/ru/articles/1001156/

#rag #retrieval_augmented_generation #llm #qdrant #yandexgpt #php #rag_pipeline #neuron

RAG на PHP + Qdrant: быстрый MVP для внутренней базы знаний

В этой статье покажу, как мы собрали RAG-систему на PHP и Qdrant: выбрали векторную базу и LLM, настроили гибридный поиск и реализовали чат-бота на Symfony с использованием PHP фреймворка Neuron AI. К...

Хабр