StepFun (@StepFun_ai)
마지막 누락 요소 공개: SFT(지도형 파인튜닝) 훈련용 데이터셋이 Hugging Face에 공개되었습니다(예: Step-3.5-Flash-SFT). 연구자와 개발자가 모델 SFT 훈련에 바로 사용할 수 있는 데이터셋 릴리스입니다.
StepFun (@StepFun_ai)
기본 모델과 코드 공개를 알리는 트윗입니다. 'Step 3.5 Flash Base'라는 사전학습된 foundation 모델과, 코드 및 에이전트를 포함한 'Step 3.5 Flash Base-Midtrain'을 공개했으며, 오픈소스 코드 'SteptronOSS'를 배포했다고 밝힘. SFT(지도적 파인튜닝) 데이터는 추후 공개 예정이라고 안내하며 'maximum sincerity, minimum barriers'라는 개방성 원칙을 강조함.

"can we get the base model?" sure. here's two. "can we get the code?" sure. here's SteptronOSS. "what about the SFT data?" coming soon. maximum sincerity, minimum barriers. - Step 3.5 Flash Base — pretrained foundation - Step 3.5 Flash Base-Midtrain — code, agents &
via #AIFoundry : Beyond the Prompt – Why and How to Fine-tune Your Own Models
https://ift.tt/DpcF2h4
#finetuning #microsoftfoundry #azureai #enterpriseai #llm #languagemodels #foundationmodels #promptengineering #rag #retrievalaugmentedgeneration #sft #supervisedfinetuning #r…

Large Language Models (LLMs) have reached a point where general intelligence is no longer the bottleneck. The real challenge in enterprise AI systems behavioral alignment ensuring models that produce consistent, reliable, policy-compliant outputs on a scale. Prompt engineering and Retrieval-Augmented Generation (RAG) are powerful but they do not change model behavior. Fine-tuning will solve this […]
⚠️ #ExpertsJudiciaires :
La #SFT œuvre depuis 2024 à l'inscription dans la loi de #ConditionsDePaiement de 30 jours, conformément à la directive 2011/7/UE.
👉 l’instauration d'un délai max de 180 jours normalisera les délais excessifs et fragilisera des professionnels indispensables à la #justice.
📣 La #SFT appelle à sensibiliser les #députés avant le vote. #DélaisDePaiement @justice_gouv
https://www.sft.fr/fr/news/delais-de-paiement-des-experts-judiciaires-la-sft-alerte-sur-la-proposition-de-loi-n-263-316

Dans le cadre de l'examen de la proposition de loi n° 263, actuellement débattue au Parlement, la Commission Experts judiciaires de la Société française des traducteurs (SFT) a adressé un courrier au sénateur Antoine Lefèvre, auteur du texte, afin d'attirer son attention sur les dispositions relatives aux conditions de paiement des collaborateurs occasionnels du service public, et en particulier des experts judiciaires. Cette démarche s'inscrit dans une mobilisation engagée depuis plusieurs mois par plusieurs organisations professionnelles, dont la SFT, face à des retards de paiement structurels qui fragilisent l'exercice des missions d'expertise judiciaire. La réponse transmise par le cabinet du sénateur, jointe au présent communiqué, précise la position retenue quant au délai maximal de paiement envisagé par la proposition de loi. La SFT a estimé nécessaire de rendre publics ces échanges afin de permettre à chacun – professionnels, décideurs et citoyens – de comprendre les arguments avancés ainsi que les conséquences concrètes du texte envisagé. Les points qui suivent visent à éclairer les principaux éléments de désaccord soulevés par cette réponse. 1. Sur la qualification des expertises judiciaires La position consistant à exclure les expertises judiciaires du champ des directives européennes relatives aux délais de paiement repose sur une interprétation restrictive, qui entre en contradiction avec la jurisprudence de la Cour de justice de l'Union européenne (Arrêt CJUE, 17 mars 2011, Josep Peñarroja Fa), laquelle qualifie ces missions de prestations de services. Cette divergence d'analyse est au cœur du désaccord exprimé par la SFT. 2. Sur le délai maximal de 180 jours Présenter un délai maximal de 180 jours comme une avancée, au motif que le droit actuellement en vigueur ne prévoit aucun plafond, revient à institutionnaliser des pratiques de paiement déjà excessives. Un tel délai demeure sans équivalent dans le reste de l'économie et place les experts judiciaires dans une situation durablement précaire. 3. Sur les conséquences concrètes du texte L'inscription dans la loi d'un délai aussi long comporte un risque évident d'alignement par le plafond, conduisant certaines juridictions à retarder leurs paiements jusqu'au maximum autorisé. Cette évolution irait à l'encontre de l'objectif affiché d'amélioration des conditions d'exercice des collaborateurs occasionnels du service public et fragiliserait davantage des professionnels déjà confrontés à des retards structurels. 4. Sur l'argument constitutionnel invoqué La réponse du cabinet du sénateur précise que l'article 40 de la Constitution interdit aux parlementaires, par voie d'amendement, de réduire le délai prévu, au motif qu'une telle mesure constituerait une aggravation de la charge publique. Elle rappelle également que, conformément à une tradition suivie dans les deux assemblées, la recevabilité financière est interprétée de manière plus souple pour les propositions de loi que pour les amendements, afin de ne pas restreindre excessivement le droit d'initiative parlementaire garanti par l'article 39 de la Constitution. Cette précision confirme que le choix d'un délai maximal de 180 jours relève d'une option retenue lors de la rédaction initiale de la proposition de loi. Dès lors, l'invocation de l'article 40 ne saurait occulter le fait que d'autres équilibres, plus compatibles avec la réalité économique des experts judiciaires et avec les standards européens, auraient pu être retenus sans méconnaître les règles constitutionnelles. La SFT rappelle que la reconnaissance effective du rôle des experts judiciaires passe nécessairement par des conditions de paiement raisonnables, compatibles avec l'exercice normal d'une activité professionnelle et avec les obligations fiscales et sociales auxquelles ces professionnels sont soumis. Elle poursuivra ses démarches afin que cette question soit pleinement prise en compte dans les prochaines étapes du débat législatif, notamment lors de l'examen du texte par l'Assemblée nationale. Appel à mobilisation La SFT appelle les experts judiciaires et les organisations professionnelles concernées à se mobiliser en : sensibilisant, au moyen de son kit de sensibilisation parlementaire, les députés de leur circonscription avant l'examen du texte à l'Assemblée nationale, soutenant la position portée par la SFT, relayant largement cette information afin de rendre visible l'impact concret de délais de paiement de 180 jours sur le fonctionnement de la justice.La commission Experts judiciaires de la SFT
[Перевод] Как Claude научился файн-тюнить опенсорсные LLM
Claude Code теперь умеет сам файнтюнить LLM на облачных GPU — от валидации датасета до пуша модели на Hub. Показываю, как это работает.
https://habr.com/ru/articles/973898/
#Claude_Code #finetuning #Hugging_Face #LLM #AIагенты #машинное_обучение #LoRA #SFT #DPO #opensource
SFT vs RL: Сравнение методов настройки LLM для задач программирования и игровых сред
В современной разработке AI-агентов возникает необходимость адаптации больших языковых моделей (LLM) для решения специфических задач, требующих не просто генерации текста, а выполнения последовательных действий с рассуждениями. В этой статье мы рассмотрим и сравним два основных подхода к настройке моделей: Supervised Fine-Tuning (SFT) и Reinforcement Learning (RL), используя библиотеку TRL (Transformer Reinforcement Learning) от Hugging Face.
Pour les traduct@s encore affiliés à la #Cipav pour la retraite, il y a des élections en décembre et la #SFT présente des candidates traductrices :
* le collège n°3 (interpro) : binôme composé de Julinda FERNANDES (Traductrice-expert judiciaire) & Caroline SUBRA-ITSUTSUJI (Traductrice-expert judiciaire)
*le collège n°4 (prestataire) : binôme composé de Pia EDSTRÖM BOURDEAU (Ingénieur traducteur interprète) & Christine DURBAN (Traductrice)
Infos plus générales https://unapl.fr/cipav/