Mastodawn

Почему маленькие модели побеждают большие – и что это значит для вашего стека

Есть такое устойчивое интеллектуальное заблуждение: если модель больше — значит, она лучше. Больше параметров, больше обучающих данных, больше денег в предобучении — и вот вам SOTA. Гонка за размером казалась единственной игрой в городе. Но в 2025–2026 годах что‑то сломалось в этой логике. И сломалось публично, с цифрами и бенчмарками. Я хочу рассказать три истории, которые произошли практически одновременно и складываются в одну картину. Первая — про то, как Microsoft заткнула за пояс «самую опасную» языковую модель Anthropic с помощью ста специализированных агентов. Вторая — про MIT‑трюк, позволяющий маленькой GPT-5-mini обогнать полноразмерный GPT-5 вдвое на сложных задачах. Третья — про китайскую модель Qwen, которую сделала небольшая команда с ограниченными ресурсами, и которая сейчас работает в 200 000 продуктах по всему миру. В каждой истории маленький (или менее очевидный) игрок побеждает «большого». И каждый раз причина примерно одна и та же.

https://habr.com/ru/articles/1043590/

#llm #gpt5mini #qwen #claude_mythos #rlm #архитектура_иимоделей #ииоркестрация #rag

Почему маленькие модели побеждают большие – и что это значит для вашего стека

Хабр

Red Letter Media (unofficial)3d ago

Half in the Bag: Backrooms
#rlm #redlettermedia #halfinthebag #Backrooms #BackroomsFilm #backroomsmovie

https://youtu.be/LmElkRi8fCU

Half in the Bag: Backrooms

YouTube

Show thread

Zuri (he/him) ❌️👑 | 🕐 CET 4d ago

" #AIReasoning finally let's you see what the #AI really thinks."

#LLMs don't *think*, they predict the next token.

"Researchers have uncovered that the AI cheats when they turned on reasoning."

Ever thought about reasoning also being text output just like non-reasoning, entirely controlled by the AI whose entire job it is to generate sycophantic text output? This output is always something made for human consumption, it is never, however, an *internal* state

#LRM #RLM #noAI #AIHype