Три попытки обогнать в бенче базовую Gemma 4 дообучением — и все три мимо

Две недели мы пытались обогнать собственную базу. Файнтюном. Потом ещё раз файнтюном на переделанном корпусе. Потом — RAG. Все три раунда база выиграла. Это статья про отрицательный результат. Я считаю, он полезнее победы — потому что воспроизводимый и объясняет, какой инструмент под какую задачу. Дальше — цифры, стек и три разбора «почему не взлетело».

https://habr.com/ru/articles/1040322/

#llm #gemma4 #dora #lora #sft #llmjudge

Три попытки обогнать в бенче базовую Gemma 4 дообучением — и все три мимо

У нас есть открытый бенчмарк https://github.com/csylabs-org/lii-sport-bench-ru для оценки русскоязычных LLM на спортивном домене — ЛИИ-Спорт-Bench-RU, 655 экспертных вопросов по 35 видам спорта. В...

Хабр

Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B

Прогнали семь LLM через свой русский спортивный бенчмарк. Топовые модели closed-source выигрывают 1.5-1.7 балла. Базовой моделью всё равно остаётся Gemma 4 31B — рассказываю почему.

https://habr.com/ru/articles/1036448/

#llm #бенчмарк #gemma #qwen #openrouter #русский_язык #dora #sft #спорт #llmjudge

Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B

TL;DR — leaderboard за один взгляд За последние 2 недели собрал открытый бенчмарк из 655 экспертных вопросов по 35 видам спорта на русском. Запустил семь моделей через ансамбль из трёх судей: Claude...

Хабр

Флоу комфорта: как искусственный интеллект в колонках Сбер научился создавать сценарии умного дома

Салют, Хабр! Я Иван, руковожу направлением голосового управления умным домом в SberDevices. Недавно мы обучили ГигаЧат в интеллектуальных колонках Сбер помогать в создании сценариев автоматизации голосом. Эта задача была неизбежной: общение на естественном языке — закономерный этап развития умных устройств. И непростой: реализовать управление умным домом на естественном языке сложнее, чем «болталку». Во-первых, у каждого юзера в умном доме свой набор комнат и устройств, их функций, названий. Во-вторых, умному дому нельзя ошибаться . Сегодня расскажу, где в пайплайне обработки запроса общение с бэкендом, почему выбрали обучение на уровне контекста вместо supervised fine-tuning и что такое сценарная машина.

https://habr.com/ru/companies/sberdevices/articles/1034306/

#Умный_дом_Сбер #колонки_Сбер #ИИ #SFT #промпт #обучение_ИИ

Флоу комфорта: как искусственный интеллект в колонках Сбер научился создавать сценарии умного дома

Салют, Хабр! Я Иван, руковожу направлением голосового управления умным домом в SberDevices. Недавно мы обучили ГигаЧат в интеллектуальных колонках Сбер помогать в создании сценариев автоматизации...

Хабр
GestaltLabs/Nemostein-3-Nano-Omni-30b-a3b · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Beautiful weather for takeoff from Skellefteå airport (Sweden) “ESNS 230750Z 22011KT 180V260 CAVOK 06/M03 Q0997” : See what it means on https://www.bigorre.org/aero/meteo/esns/en #skellefteaairport #airport #skelleftea #sweden #esns #sft #metar #aviation #aviationweather #avgeek vl
Skellefteå airport (Sweden) aviation weather and informations ESNS SFT

Aviation weather with TAF and METAR, Maps, hotels and aeronautical information for Skellefteå airport (Sweden)

Bigorre.org
Beyond the Prompt - Why and How to Fine-tune Your Own Models | Microsoft Foundry Blog

Large Language Models (LLMs) have reached a point where general intelligence is no longer the bottleneck. The real challenge in enterprise AI systems behavioral alignment ensuring models that produce consistent, reliable, policy-compliant outputs on a scale. Prompt engineering and Retrieval-Augmented Generation (RAG) are powerful but they do not change model behavior. Fine-tuning will solve this […]

Microsoft Foundry Blog
Beautiful weather for takeoff from Skellefteå airport (Sweden) “ESNS 300720Z 26003KT CAVOK M23/M26 Q1027” : See what it means on https://www.bigorre.org/aero/meteo/esns/en #skellefteaairport #airport #skelleftea #sweden #esns #sft #metar #aviation #aviationweather #avgeek vl

ICAO: 45AB21
Flt: JTD805 #JETTIME #LPA - #SFT
First seen: 2026-01-22 13:24:13 CET
Min Alt: 11264 m AGL
Min Dist: 18.04 km

https://globe.adsbexchange.com/?icao=45ab21&lat=53.029935&lon=6.067043&zoom=12&showTrace=2026-01-22
#adsb #aboveFRL #EHLW

⚠️ #ExpertsJudiciaires :
La #SFT œuvre depuis 2024 à l'inscription dans la loi de #ConditionsDePaiement de 30 jours, conformément à la directive 2011/7/UE.

👉 l’instauration d'un délai max de 180 jours normalisera les délais excessifs et fragilisera des professionnels indispensables à la #justice.
📣 La #SFT appelle à sensibiliser les #députés avant le vote. #DélaisDePaiement @justice_gouv
https://www.sft.fr/fr/news/delais-de-paiement-des-experts-judiciaires-la-sft-alerte-sur-la-proposition-de-loi-n-263-316

Délais de paiement des experts judiciaires : la SFT alerte sur la proposition de loi n°263

Dans le cadre de l'examen de la proposition de loi n° 263, actuellement débattue au Parlement, la Commission Experts judiciaires de la Société française des traducteurs (SFT) a adressé un courrier au sénateur Antoine Lefèvre, auteur du texte, afin d'attirer son attention sur les dispositions relatives aux conditions de paiement des collaborateurs occasionnels du service public, et en particulier des experts judiciaires. Cette démarche s'inscrit dans une mobilisation engagée depuis plusieurs mois par plusieurs organisations professionnelles, dont la SFT, face à des retards de paiement structurels qui fragilisent l'exercice des missions d'expertise judiciaire. La réponse transmise par le cabinet du sénateur, jointe au présent communiqué, précise la position retenue quant au délai maximal de paiement envisagé par la proposition de loi. La SFT a estimé nécessaire de rendre publics ces échanges afin de permettre à chacun – professionnels, décideurs et citoyens – de comprendre les arguments avancés ainsi que les conséquences concrètes du texte envisagé. Les points qui suivent visent à éclairer les principaux éléments de désaccord soulevés par cette réponse. 1. Sur la qualification des expertises judiciaires La position consistant à exclure les expertises judiciaires du champ des directives européennes relatives aux délais de paiement repose sur une interprétation restrictive, qui entre en contradiction avec la jurisprudence de la Cour de justice de l'Union européenne (Arrêt CJUE, 17 mars 2011, Josep Peñarroja Fa), laquelle qualifie ces missions de prestations de services. Cette divergence d'analyse est au cœur du désaccord exprimé par la SFT. 2. Sur le délai maximal de 180 jours Présenter un délai maximal de 180 jours comme une avancée, au motif que le droit actuellement en vigueur ne prévoit aucun plafond, revient à institutionnaliser des pratiques de paiement déjà excessives. Un tel délai demeure sans équivalent dans le reste de l'économie et place les experts judiciaires dans une situation durablement précaire. 3. Sur les conséquences concrètes du texte L'inscription dans la loi d'un délai aussi long comporte un risque évident d'alignement par le plafond, conduisant certaines juridictions à retarder leurs paiements jusqu'au maximum autorisé. Cette évolution irait à l'encontre de l'objectif affiché d'amélioration des conditions d'exercice des collaborateurs occasionnels du service public et fragiliserait davantage des professionnels déjà confrontés à des retards structurels. 4. Sur l'argument constitutionnel invoqué La réponse du cabinet du sénateur précise que l'article 40 de la Constitution interdit aux parlementaires, par voie d'amendement, de réduire le délai prévu, au motif qu'une telle mesure constituerait une aggravation de la charge publique. Elle rappelle également que, conformément à une tradition suivie dans les deux assemblées, la recevabilité financière est interprétée de manière plus souple pour les propositions de loi que pour les amendements, afin de ne pas restreindre excessivement le droit d'initiative parlementaire garanti par l'article 39 de la Constitution. Cette précision confirme que le choix d'un délai maximal de 180 jours relève d'une option retenue lors de la rédaction initiale de la proposition de loi. Dès lors, l'invocation de l'article 40 ne saurait occulter le fait que d'autres équilibres, plus compatibles avec la réalité économique des experts judiciaires et avec les standards européens, auraient pu être retenus sans méconnaître les règles constitutionnelles. La SFT rappelle que la reconnaissance effective du rôle des experts judiciaires passe nécessairement par des conditions de paiement raisonnables, compatibles avec l'exercice normal d'une activité professionnelle et avec les obligations fiscales et sociales auxquelles ces professionnels sont soumis. Elle poursuivra ses démarches afin que cette question soit pleinement prise en compte dans les prochaines étapes du débat législatif, notamment lors de l'examen du texte par l'Assemblée nationale. Appel à mobilisation La SFT appelle les experts judiciaires et les organisations professionnelles concernées à se mobiliser en : sensibilisant, au moyen de son kit de sensibilisation parlementaire, les députés de leur circonscription avant l'examen du texte à l'Assemblée nationale, soutenant la position portée par la SFT, relayant largement cette information afin de rendre visible l'impact concret de délais de paiement de 180 jours sur le fonctionnement de la justice.La commission Experts judiciaires de la SFT

[Перевод] Как Claude научился файн-тюнить опенсорсные LLM

Claude Code теперь умеет сам файнтюнить LLM на облачных GPU — от валидации датасета до пуша модели на Hub. Показываю, как это работает.

https://habr.com/ru/articles/973898/

#Claude_Code #finetuning #Hugging_Face #LLM #AIагенты #машинное_обучение #LoRA #SFT #DPO #opensource

Как Claude научился файн-тюнить опенсорсные LLM

Claude получил возможность файн-тюнить языковые модели с помощью нового инструмента под названием  Hugging Face Skills . Не просто писать скрипты для обучения, а реально отправлять задачи на...

Хабр