LLM — 3 «семёрки» против SOTA, строим «градиентный бустинг» из SLM моделей

Превращаем LLM в CatBoost: как ансамбль из маленьких моделей (7B) пытается побить Gemini 3 flash Почему не классическое MOE? Я проанализировал свои промпты за последние два месяца и заметил паттерн: современные задачи к LLM стали мульти-итентными . Я прошу в одном сообщении: "Возьми данные X, примени логику Y, напиши код Z и оформи в JSON" . Архитектура MoE в таких случаях плывет (если мы говорим о single-turn конечно) . Single-pass модели часто не справляются, так как не могут реверснуть свой ответ и перепроверить себя перед ответом. К тому же роутер может отдать запрос не тому "эксперту", может неправильно чанковать (условно), в целом мы это и наблюдаем в gemini 3. Текущая предложенная архитектура бустинга решает эту проблему через последовательную ответственность. Первая модель (черновик) пытается сделать всё сразу (и ошибается), вторая (Критик) проверяет выполнение условий постфактум, третья (фиксер) работает с тз критика и исправляет ответ. Такой цикл может длиться от 2 до множества операций, что может значительно экономить ресурсы и улучшать качество ответа (изначальный тезис). При этом даже SOTA-модели пытаются решить всё в один проход , и именно поэтому они «плывут» на сложных мульти-интентных задачах. Текущий подход - итеративное улучшение ответа между разными моделями. Но, пожалуйста, держите в голове что это не классический бустинг и к тому же этап инференса, а не обучения. Пару ремарок которые можно пропустить если вы и так знакомы с терминами и dl/ml и не интересуетесь архитектурой:

https://habr.com/ru/articles/991370/

#ml #ai #promptengineering #data_sciense #engeneering

LLM — 3 «семёрки» против SOTA, строим «градиентный бустинг» из SLM моделей

Превращаем LLM в CatBoost: как ансамбль из маленьких моделей (7B) пытается побить Gemini 3 flash Почему не классическое MOE? Я проанализировал свои промпты за последние два месяца и заметил паттерн:...

Хабр

10 lessons learned in the open meshing project with #Gmsh, by Christophe Geuzaine

#OpenSource #OpenScience #OpenScienceDay #ULiège #IT #development #engeneering

Физики или лирики: чей час настал на рынке труда?

На протяжении десятилетий в массовой культуре укоренилась идея о разделении мозга на два полушария — аналитическое «левое» и творческое «правое». Согласно этому упрощенному взгляду, люди и, соответственно, их профессиональный выбор делятся на два лагеря: логичные «технари» с доминирующим левым полушарием и образные «гуманитарии» с ведущим правым.

https://habr.com/ru/articles/966164/

#gamedesign #engeneering #рынок_труда #трудоустройство_специалистов #заработная_плата #hhru #аналитика #avito #физики_и_лирики #высшее_образование

Физики или лирики: чей час настал на рынке труда?

На протяжении десятилетий в массовой культуре укоренилась идея о разделении мозга на два полушария — аналитическое «левое» и творческое «правое». Согласно этому упрощенному взгляду, люди и,...

Хабр

Everyone's rewriting the world in Rust, except the world.

We still run banks on COBOL, kernels on C, and dreams on YAML. Rust is great. But not everywhere.

You don't rebuild civilisation because a new hammer came out, right? Maybe you would, in this case, this post could be something cool for you to read:

https://jeferson.me/blog/2025/10/31/are-we-rust-yet/

#Cobol #Coding #Dev #Developer #Engineer #Engeneering #Linux #Performance #Programming #Rustlang #SoftwareEngineering #WebDev #Rust

Are we Rust yet?

Everyone's rewriting the world in Rust, except the world. We still run banks on COBOL, kernels on C, and dreams on YAML. Rust is great. But not everywhere. You don't rebuild civilization because a new hammer came out. Sometimes performance isn't the bottleneck, it's your team, your CTO, or your ego. So before you rewrite your CRM in Rust 'for safety' maybe ask if we really need it.

A section of transmission/power substation in Wichita, Kansas, United States of North America

@photography

#Kansas #Engeneering #USA #SmartphonePhotography #Photography #MobilePhotography #AmateurPhotography #MidWest #ThePlains #ICT #WichitaKansas #WichitaKS

The Boeing Scandal Just Got A LOT Worse

YouTube
How ChatGPT could replace IT network engineers

Specificity reigns supreme when it comes to putting ChatGPT to work. Why the chatbot won't eliminate network engineers (just yet).

VentureBeat
Dec 6: I will remember these 14 women: Geneviève Bergeron, Helene Colgan, Nathalie Croteau, Barbara Daigneault, Anne-Marie Edward, Maud Haviernick, Barbara Klucznik-Widajewicz, Maryse Laganière, Maryse Leclair, Anne-Marie Lemay, Sonia Pelletier, Michèle Richard, Annie St-Arneault, Annie Turcotte.
I was in grade 9, it was a stark lesson on the patriarchy and the violence done to women. #ViolenceAgainstWomen #dec6 #engeneering #ecolePolytechnique