個人主觀感覺排名: #Qwen3 > #DeepSeekV31 ~ #Glm45 > #MiniMaxM1 ~ #KimiK2 ~ #Ernie45

實際上它們之間的差距很小,如果 GPT-5 是90分它們基本上都有70分左右,Qwen3 有80分左右,#DeepSeekV31 用得還不多大概也是70分左右,沒有很強。 #DeepSeekV31最強是它的超高性價比,一如以往R1推出的時候,一口氣把價格壓下來。

#MiniMaxM1 用過也不差,個人覺得和 #Glm45 是差不多的水平,一樣是比不上 #DeepSeek

MiniMax-M1: Разбираем архитектуру, ломающую законы масштабирования (и наш VRAM)

В мире LLM доминирует квадратичная сложность, ограничивающая контекст. Но MiniMax-M1 бросает вызов: миллион токенов, низкие затраты. Разбираем гибридную архитектуру с Lightning Attention, новый алгоритм CISPO и инженерные прорывы, делающие эту модель уникальной.

https://habr.com/ru/articles/923588/

#minimaxm1 #LLM_архитектура #Lightning_Attention #mixtureofexperts #масштабирование_LLM

MiniMax-M1: Разбираем архитектуру, ломающую законы масштабирования (и наш VRAM)

В последние годы мы наблюдаем настоящую гонку вооружений в мире LLM. Главный девиз — «Больше, выше, сильнее!». Больше параметров, больше данных, больше вычислительных мощностей. Но эта гонка упирается...

Хабр
🥳🤖 Behold, the MiniMax-M1: yet another gloriously named Frankenstein of jargon that promises to solve all your coding woes while draining your soul one AI-generated line at a time. Because clearly, what the world needed was an "open-weight, large-scale hybrid-attention reasoning model" that's harder to understand than quantum physics—and twice as useful. 🚀💻
https://github.com/MiniMax-AI/MiniMax-M1 #MiniMaxM1 #AIcoding #TechHumor #HybridAttention #QuantumPhysics #HackerNews #ngated
GitHub - MiniMax-AI/MiniMax-M1: MiniMax-M1, the world's first open-weight, large-scale hybrid-attention reasoning model.

MiniMax-M1, the world's first open-weight, large-scale hybrid-attention reasoning model. - MiniMax-AI/MiniMax-M1

GitHub