#FairTradeMusicFriday Le saviez-vous ? Vous pouvez retrouver toutes mes vidéos sur #PeerTube @MakerTube : https://makertube.net/c/nicolas_hussein/videos Vous y trouverez mes concerts, compositions, arrangements et orchestrations, sur une plateforme libre, sans publicité, et avec possibilité de me soutenir financièrement.

#myWork #musique #music #NewMusic #composition #arrangement #orchestration @music

Nicolas Hussein

Altiste professionnel diplômé du CRR de Paris, professeur en école de musique, et musicien dans différents orchestres et ensembles, j’ai à cœur de transmettre ma passion et mon savoir-faire. Diplôm...

MakerTube

#FairTradeMusicFriday Le saviez-vous ? Vous pouvez retrouver mes compositions, arrangements et orchestrations sur @mirlo : https://mirlo.space/nicolas-hussein/ Vous pouvez écouter en format audio seul, sans publicité. Et me soutenir financièrement en achetant à prix libre.

#myWork #musique #music #NewMusic #composition #arrangement #orchestration @music

Nicolas Hussein

Altiste - Compositeur - Arrangeur

Nicolas Hussein

#MercrediPromo Le saviez-vous ? Vous pouvez retrouver toutes mes vidéos sur #PeerTube @MakerTube : https://makertube.net/c/nicolas_hussein/videos Vous y trouverez mes concerts, compositions, arrangements et orchestrations, sur une plateforme libre, sans publicité, et avec possibilité de me soutenir financièrement.

#myWork #musique #music #NewMusic #composition #arrangement #orchestration @music

Nicolas Hussein

Altiste professionnel diplômé du CRR de Paris, professeur en école de musique, et musicien dans différents orchestres et ensembles, j’ai à cœur de transmettre ma passion et mon savoir-faire. Diplôm...

MakerTube

Evals для чайников. Как тестировать AI-агента, чтобы понимать, где именно он ломается

Большинство команд оценивают производительность AI-агентов через end-to-end метрики: success rate, количество токенов, tool usage, стоимость запроса, долю успешных задач. Это полезно для общего контроля ситуации, но почти бесполезно для реальной диагностики системы. Например, если success rate упал с 85% до 72%, то само по себе число не объясняет причину деградации. Команда вынуждена гадать, какая часть системы вдруг начала допускать ошибки. Сломался retrieval? Модель хуже начала выбирать инструменты? Контекст загрязняется после нескольких ходов? Или система уперлась в возможности base model? При росте проекта и увеличении сложности кодовой базы, сбои начинают расти мультипликативно – ошибки всех систем начинают перемножаться между собой. В конечном итоге, команда теряет реальный контроль. Проблему решает внедрение покомпонентных eval. Они дополняют end-to-end метрики, показывая, какой слой AI-агента работает, какой деградировал – и где именно искать причину. То есть внедрение evals помогает получать метрики производительности каждого компонента вашего агента.

https://habr.com/ru/articles/1042924/

#aiагенты #llm #rag #evals #orchestration #retrieval #tool_calling #context_engineering #production #ai_infrastructure

Evals для чайников. Как тестировать AI-агента, чтобы понимать, где именно он ломается

Большинство команд оценивают производительность AI-агентов через end-to-end метрики: success rate, количество токенов, tool usage, стоимость запроса, долю успешных задач. Это полезно для общего...

Хабр
Orchestrating AI Code Review at scale

Learn about how we built a CI-native AI code reviewer using OpenCode that helps our engineers ship better, safer code.

The Cloudflare Blog

#FairTradeMusicFriday Le saviez-vous ? Vous pouvez retrouver toutes mes vidéos sur #PeerTube @MakerTube : https://makertube.net/c/nicolas_hussein/videos Vous y trouverez mes concerts, compositions, arrangements et orchestrations, sur une plateforme libre, sans publicité, et avec possibilité de me soutenir financièrement.

#myWork #musique #music #NewMusic #composition #arrangement #orchestration @music

Nicolas Hussein

Altiste professionnel diplômé du CRR de Paris, professeur en école de musique, et musicien dans différents orchestres et ensembles, j’ai à cœur de transmettre ma passion et mon savoir-faire. Diplôm...

MakerTube

#FairTradeMusicFriday Le saviez-vous ? Vous pouvez retrouver mes compositions, arrangements et orchestrations sur @mirlo : https://mirlo.space/nicolas-hussein/ Vous pouvez écouter en format audio seul, sans publicité. Et me soutenir financièrement en achetant à prix libre.

#myWork #musique #music #NewMusic #composition #arrangement #orchestration @music

Nicolas Hussein

Altiste - Compositeur - Arrangeur

Nicolas Hussein

#JeudiAutoEdition Redécouvrez aujourd'hui mon #orchestration des 3 intermezzi pour piano op. 117 de Johannes #Brahms, l’un de mes compositeurs favoris ➡️ https://nicolashussein.fr/produit/johannes-brahms-3-intermezzi-pour-piano-op-117/

Disponible sur Amazon (papier/ebook), The Book Edition (papier) ou Planète Partitions (papier/ebook)

#partition #musique #musiqueClassique #classicalMusic #music #myWork #orchestre #orchestra

#MercrediPromo Le saviez-vous ? Vous pouvez retrouver mes compositions, arrangements et orchestrations sur @mirlo : https://mirlo.space/nicolas-hussein/ Vous pouvez écouter en format audio seul, sans publicité. Et me soutenir financièrement en achetant à prix libre.

#myWork #musique #music #NewMusic #composition #arrangement #orchestration @music

Nicolas Hussein

Altiste - Compositeur - Arrangeur

Nicolas Hussein

Почему ломается ваш AI-агент — и почему смена модели обычно его не чинит

Представьте внутреннего AI-агента, который помогает компании искать общие документы и управлять ими. Он работает. До тех пор, пока 12–15% запросов не начинают падать. Агент возвращает не тот документ, редактирует не тот файл, молча падает или уверенно ссылается на файл, которого не существует. Поиск по фото отказывает с той же частотой. Ошибки размазаны равномерно по пользователям, фичам и запросам. Первое инстинктивное действие — поменять модель. Opus 4.5, GPT 5.5 или что там сейчас в топе лидерборда. Меняете. Счет за инференс растет в 4–5 раз, а общая доля ошибок снижается с 12% до 9%. Пользователи пишут о тех же проблемах. Бюджет следующего квартала сгорает за пару недель ради улучшения в 3 процентных пункта — и вы по-прежнему не понимаете, что именно было не так в системе и как улучшать ее дальше. Эта статья — о том, почему смена модели обычно разочаровывает и куда стоит смотреть в первую очередь. Большинство сбоев AI-систем живет в слое обвязки — orchestration, retrieval, tool definitions, retries, context management, — а не в самой модели. Дальше — метод, как отличить проблемы обвязки от проблем модели, кейс, в котором одно исправление в обвязке подняло completion rate с 26% до 88% без смены модели, и чек-лист, который помогает находить такие сбои в вашей собственной системе. Если вы никогда не делали подобной диагностики — ожидайте найти хотя бы один пункт, который стоит починить.

https://habr.com/ru/articles/1039292/

#aiагенты #llm #rag #orchestration #retrieval #tool_calling #context_engineering #evals #production #ai_infrastructure

Почему ломается ваш AI-агент — и почему смена модели обычно его не чинит

Представьте внутреннего AI-агента, который помогает компании искать общие документы и управлять ими. Он работает. До тех пор, пока 12–15% запросов не начинают падать. Агент возвращает не тот документ,...

Хабр