Как мы с Claude Code учились оценивать качество RAG системы

Уверен, на Хабре найдётся немало статей, посвященных оценке качества RAG систем. Тема по-прежнему остаётся актуальной, потому что даже готовые библиотеки вроде RAGAS не очень-то работают из коробки и требуют навыков программирования и некоторой квалификации. При этом сам процесс оценки - повторение достаточно простых операций и мне всегда хотелось переложить его на AI-ассистента. Повод попробовать появился неожиданно: свободное время и курс по Claude Code на Stepik. Для финала как раз нужен был проект, посвященный автоматизации реальной рутинной задачи, желательно без кода (курс про вайб-воркинг, для непрограммистов). Конечно, я сразу вспомнил про задачу оценки качества. Дальше - честная история со всеми проблемами. Забегая вперёд, скажу, что совсем без программирования не вышло. Но, может, это профессиональная деформация.

https://habr.com/ru/articles/1049028/

#claudecode #skillmd #rag_api #rag_система #автоматизация_рутины #клод_код #mcpserver #оценка_качества

Как мы с Claude Code учились оценивать качество RAG системы

Уверен, на Хабре найдётся немало статей, посвященных оценке качества RAG систем. Тема по-прежнему остаётся актуальной, потому что даже готовые библиотеки вроде RAGAS не очень-то работают из коробки,...

Хабр
MCP is not always the "modern" choice. For mission-critical workflows in regulated industries, keeping orchestration control in your app layer is accountability https://hackernoon.com/function-calling-vs-mcp-tool-calling-what-nobody-tells-you-before-you-choose #mcpserver
Function Calling vs. MCP Tool Calling: What Nobody Tells You Before You Choose | HackerNoon

MCP is not always the "modern" choice. For mission-critical workflows in regulated industries, keeping orchestration control in your app layer is accountability

Azure MCP tools now ship built into Visual Studio 2022 — no extension required - Visual Studio Blog

Azure MCP tools are now built into Visual Studio 2022 as part of the Azure development workload — no separate extension to find, install, or update. You can enable over 230 tools across 45 Azure services directly in GitHub Copilot Chat and manage Azure resources, deployments, and diagnostics without leaving your IDE. If you already have the Azure development workload installed, you're one click away from getting started.

Visual Studio Blog

Развиваем ИИ-платформу в 1С

Статья о том, как мы пришли к ИИ для 1С и что из этого вышло. Материал получился про попытку собрать полноценную ИИ-платформу для работы с учетными данными. Расскажу, зачем нам понадобился MCP, как мы связали его с 1С:Шина, почему отдельно уперлись в права доступа и как в итоге устроили агента внутри 1С. Также покажу, где видим место для skills, RAG и OCR, и что пока не стали отдавать модели на самостоятельное выполнение.

https://habr.com/ru/companies/cinimex/articles/1046197/

#1с #иипомощник #mcpserver #function_calling #агент #rag #ocr #права_доступа #локальные_модели #gptoss

Развиваем ИИ-платформу в 1С

Привет! Я - Роман Коротаев, ресурсный руководитель направления 1С в компании Синимекс. В этом материале хочу рассказать, как мы пришли к ИИ для 1С и что из этого вышло. Материал получился про попытку...

Хабр

Паттерн экономии токенов в Claude Code на правке файлов

Как обычно, я сидел и думал, как бы уменьшить расходы токенов в Claude Code.. Рефлексировал содержимое сессий, исследовал вместе с самим Claude Code и наткнулся на интересную штуку. Сначала я было хотел написать свой писатель файлов из под клода, вместо Write. Но подумал, что это будет слишком напряжно, если делать это в клоде, поддерживать, и так далее. Но для редактирования файла его надо читать(обязательно! Как минимум в Claude Code) - что логично. Вопрос: а сколько его надо читать? Конкретно сколько строк его надо читать? Теоретически весь? А практически? Для замены, к примеру, одной строки?! И да, Read читает по-разному, Но всегда больше одной строки(мелкие файлы читаются за один Read)..Ок, а обязательно ли для редактирования читать весь файл(или куски)? И вот вот тут-то нас ожидает сюрприз! Для снятия "защиты" файла от редактирования (в сессии Claude Code) достаточно прочитать ОДНУ строку указанного файла:):) Если у тебя есть средство поддержки актуальности теста файла(я намекаю на code-index), то снятие гейта в модели будет выглядеть примерно как: (кусок кода сессии) Read C:\MCP-Servers\code-index\Cargo.toml (lines 2-2) Read C:\MCP-Servers\code-index\ CHANGELOG.md (lines 2-2) Read C:\MCP-Servers\code-index\CHANGELOG_ EN.md (lines 2-2) Read C:\MCP-Servers\code-index\ README.md (lines 2-2) Read C:\MCP-Servers\code-index\README_ RU.md (lines 2-2) (это я готовил к выкладке очередной апдейт code-index. Почему (2-2)? Сам не знаю, в промте указано (1-1), но везде модель ставит 2-2. Тайна сия великая есть:)). И потом просто в темпе пулемета вызываются команды Edit. Следовательно, в контекст тебе НЕ сыпятся куски файлов(которые тебе не нужны), и контекст остается максимально чистым.

https://habr.com/ru/articles/1045186/

#claudecode #индексация_кода #mcpserver

Паттерн экономии токенов в Claude Code на правке файлов

Как обычно, я сидел и думал, как бы уменьшить расходы токенов на Claude Code. Рефлексировал содержимое сессий, исследовал вместе с самим Claude Code и наткнулся на интересную штуку. Сначала я было...

Хабр
Bumper opens podcast dashboard to all creators - and adds an MCP server: Bumper Dashboard is now free for all podcasters, with new pricing tiers and a fresh MCP server that lets enterprise teams query their show data through AI. https://ppc.land/bumper-opens-podcast-dashboard-to-all-creators-and-adds-an-mcp-server/ #Podcasting #Podcasts #BumperDashboard #CreativeTools #MCPServer
Bumper opens podcast dashboard to all creators - and adds an MCP server

Bumper Dashboard is now free for all podcasters, with new pricing tiers and a fresh MCP server that lets enterprise teams query their show data through AI.

PPC Land

🚀 Neue MCP‑Server für DevOps im Fokus!

- Integrierte Automatisierungs‑ & Orchestrierungs‑Features
- Volle Unterstützung für Docker, Kubernetes & CI/CD‑Pipelines
- Zentrale Management‑Schnittstellen + API‑Zugriff für schnelle Skalierung

Perfekt, um Cloud‑ und Hybrid‑Architekturen zu beschleunigen.

#DevOps #MCPServer #Automation #Kubernetes #OpenSource

🔗 https://news.google.com/rss/articles/CBMif0FVX3lxTE44eW10a0ZOV21VSkFpelI4eXZOSXRGd1A1Skpacm1TaEVQRlNWYTBLdEhoVzY4ZXRLUWpIWXhILXRaOTR2UFp3RV90aUZ3ajJNUU9DaVJRMVU2d1hWWk1vcUg5amZ1YWV3UHk5TTRKcFl2ckdadnJrY0NTakxJT2M?oc=5

Before you continue

Я сошёл с ума и сдаю свой браузер ИИ-агентам

Я совсем поехал кукухой — начал сдавать в аренду свой браузер за деньги. Началось всё с того, что мои ИИ-агенты не смогли нормально зарегаться из-за капчей и прочего, чужие расширения меня не устраивали — они плохо интегрировались в мой флоу и были завязаны на провайдера, что полный отстой. В итоге я интегрировал это в свой пет-проект, и в итоге сделал так, что браузер в аренду может взять любой желающий. Заодно сделал SDK, CLI и доки. Вот моя история погружения в пучину безумия. Погрузиться в пучину.

https://habr.com/ru/articles/1041768/

#aiагенты #browserautomation #chromeрасширения #mcp #петпроект #mcpserver #llm #webscraping #антидетект #криптоплатежи

Я сошёл с ума и сдаю свой браузер ИИ-агентам

Безумные цены, полная распродажа, я даже не знаю что происходит. Я совсем поехал кукухой — начал сдавать в аренду свой браузер за деньги. Началось всё с того, что мои ИИ-агенты не смогли нормально...

Хабр

Как семиклассники встроили MCP сервер ВкусВилла в своего ИИ-су-шефа

Пока взрослые изучают возможности искусственного интеллекта и обсуждают его влияние на мир, школьники всё чаще воспринимают нейросети как обычный рабочий инструмент. Они не только следят за развитием технологий, но и создают собственные проекты, тестируют гипотезы и работают над продуктами для реальных пользователей. В этой статье расскажем о Papus_team — команде семиклассников из Санкт-Петербурга, которые уже создают собственные продукты и интегрируют их с реальными компаниями. Каждый участник отвечает за своё направление. Один из таких проектов — бот «Су-Шеф», который помогает придумать, что приготовить, подобрать продукты и сразу собрать корзину во ВкусВилле. Его созданием и развитием полностью занимается Никита Виноградов. Идея родилась во время обсуждения возможных проектов. Команда решила делать что-то практичное, а еда показалась понятной и близкой темой. Так появился бот, который не только предлагает рецепт, а помогает сразу закрыть вопрос с покупками.

https://habr.com/ru/companies/vkusvill/articles/1042210/

#mcp #mcpserver #ai #вкусвилл #искусственный_интеллект #искусственный_интеллект_чатбот

Как семиклассники встроили MCP сервер ВкусВилла в своего ИИ-су-шефа

Пока взрослые изучают возможности искусственного интеллекта и обсуждают его влияние на мир, школьники всё чаще воспринимают нейросети как обычный рабочий инструмент. Они не только следят за развитием...

Хабр

NXS Universal Chart v3.1.0: умный autoRollout, новые subcharts и MCP сервер

Команда

https://habr.com/ru/articles/1040230/

#devops #kubernetes #helm #deploy #mcpserver #release #infrastructureasacode #automatization #automation

NXS Universal Chart v3.1.0: умный autoRollout, новые subcharts и MCP сервер

Команда Nixys готовит к выпуску версию 3.1.0 nxs-universal-chart. Этот релиз аккумулирует все изменения, вошедшие в промежуточные сборки v3.0.10 - v3.0.21, а также новые фичи. Ниже — разбор ключевых...

Хабр