RT @MiniMax_AI: Ein beeindruckender tiefgehender Einblick des @togethercompute-Teams zum Einsatz von MiniMax M3 in der Produktion. M3 mit seinem 1-Millionen-Kontextfenster, nativer Multimodalität und der MiniMax-Sparse-Aufmerksamkeit erfordert echte Arbeit an paged decode, Index-Scoreing und multimodaler Vorverarbeitung, um Effizienz zu erreichen. So sieht eine Partnerschaft an der technologischen Spitze aus🤝. Together AI (@togethercompute) x.com/i/article/206189124776… — https://nitter.net/togethercompute/status/2061894792020197881#m

mehr auf Arint.info

#AIInfrastructure #LLMOps #MiniMaxM3 #MultimodalAI #SparseAttention #TogetherAI #arint_info

https://x.com/MiniMax_AI/status/2061913941702533241#m

MiniMax M3 Shows What Happens When AI Stops Thinking in Turns
#minimaxm3 #ai #ainews #technews #minimax
https://firethering.com/minimax-m3-open-weight-model/
MiniMax M3 Shows What Happens When AI Stops Thinking in Turns - Firethering

Most models quit around submission 30 because they stop finding improvement and exit on their own. That's what happened when MiniMax ran a CUDA kernel optimization task against a field of frontier models. Every model except two called it done within the first 30 submissions. M3's best result came on submission 145. After 24 hours. After multiple plateaus where the numbers stopped moving and a reasonable model would have concluded there was nothing left to find. That's the thing MiniMax released yesterday. An AI model with a 1M token context window, native multimodality, and apparently a problem with knowing when to stop.

Firethering

RT @gitlawb: 🟢 MiniMax M3 ist jetzt in OpenClaude verfügbar. OpenClaude (eine Coding-CLI, die mit jedem LLM funktioniert) hat gerade die erstklassige Unterstützung für MiniMax M3 hinzugefügt – das nächste Generation Coding-/Agentic-Modell von MiniMax mit einem 1.048.576-Token-Kontextfenster (1M). @MiniMaxAI Video

mehr auf Arint.info

#AgenticAI #AI #CodingCLI #LLM #MiniMaxM3 #OpenClaude #arint_info

https://x.com/gitlawb/status/2061581678871806083#m

Arint - SEO+KI (@[email protected])

<p>RT @gitlawb: 🟢 MiniMax M3 ist jetzt in OpenClaude verfügbar. OpenClaude (eine Coding-CLI, die mit jedem LLM funktioniert) hat gerade die erstklassige Unterstützung für MiniMax M3 hinzugefügt – das nächste Generation Coding-/Agentic-Modell von MiniMax mit einem 1.048.576-Token-Kontextfenster (1M). @MiniMaxAI Video</p> <p><a href="https://arint.info/@Arint/116679938797380604">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#AgenticAI #AI #CodingCLI #LLM #MiniMaxM3 #OpenClaude #arint_info</p> <p><a href="https://x.com/gitlawb/status/2061581678871806083#m">https://x.com/gitlawb/status/2061581678871806083#m</a></p>

Mastodon Glitch Edition

RT @jumperz: MiniMax m3 ist wahnsinnig und hat die eine Regel gebrochen, der jedes KI-Modell gefolgt ist: Bessere Kosten = bessere Fähigkeiten... Wenn man alle Modelle in ein Diagramm einträgt, mit den Kosten auf der einen und der Qualität auf der anderen Seite, fallen sie alle entlang einer geraden Linie... Günstige / schwächere Modelle sitzen unten links, teure / stärkere oben rechts... Du zahlst mehr, du bekommst mehr, einfach so... Stell dir eine Diagonale vor, die von günstig und schwach (unten links) zu teuer und stark (oben rechts) verläuft... Diese Linie ist der übliche Preis dafür, wie viel Leistung dein Geld kauft... Jedes Modell zahlt diesen Preis... Als m3 das erste ist, das mehr bekommt, als es bezahlt hat, und sich über der Linie positioniert, wo noch nie etwas war... ist es so leistungsfähig wie die Modelle der mittleren Frontier-Klasse, aber zum Preis der günstigsten Modelle mit $1.20... Und der größere Teil ist, dass m3 Open-Weights hat, also ist zum ersten Mal das beste Preis-Leistungs-Verhältnis im Diagramm auch das, das du vollständig besitzt.. MiniMax (offiziell) (@MiniMaxAI) Vorstellung von MiniMax M3: Das erste Open-Weights-Modell, das drei Frontier-Fähigkeiten kombiniert - Coding & Agentic Frontier: 59.0% SWE-Bench Pro, 66.0% Terminal Bench 2.1, 34.8% SWE-fficiency, 28.8% KernelBench Hard, 74.2% MCP Atlas - MiniMax Sparse Attention skaliert den Kontext auf 1M - Nativ Multimodal von Schritt Null API: platform.minimax.io Token-Plan: platform.minimax.io/subscrib… 🚀Neu! MiniMax Code: code.minimax.io Gewichte & Tech-Bericht in ~10 Tagen — https://nitter.net/MiniMaxAI/…

mehr auf Arint.info

#AIInnovation #KIModell #MachineLearning #MiniMaxM3 #OpenWeights #TechNews #arint_info

https://x.com/jumperz/status/2061376241572151513#m

https://winbuzzer.com/2026/06/01/minimax-launches-m3-with-1m-context-multimodal-push-xcxwbn/

MiniMax is pushing M3 into the long-context model race with multimodal input and a claimed 1 million-token window.

#AI #MiniMax #AIModels #MultimodalAI #AgenticAI #AICoding #MiniMaxM3 #ChinaAI

🚨 NEWS: MiniMax-M3 Sfida GPT-5.5 e Gemini 3.1 Pro con AI Open-Weight a Costo Ridotto

Ecco i punti chiave in breve:
💡 Il panorama dell'intelligenza artificiale ha subito una scossa con il rilascio di MiniMax-M3, un modello linguistico open-weight che supera GPT-5.5 e Gemini 3.1 Pro su benchmark ch...

🚀 LINK: https://meteoraweb.com/news/minimax-m3-sfida-gpt-55-e-gemini-31-pro-con-ai-open-weight-a-costo-ridotto

#intelligenzaArtificiale #sicurezzaAI #gPT5.5 #miniMaxM3 #gemini3.1Pro

還沒開始研究,但我估計27年發佈的SOTA模型都會有兩層的Attention,以後用RAG做的應用都會放在第二層裏面,能夠不依靠vector database都可以處理極大量的語料且不會影響性能,舉個例子,現在做智能客服一般都需要RAG搭建智識庫,然後不斷優化召回率和排序,27年的智能體應該可以LLM本身把整個知識庫加載進去attention,這裏還需要做prompt processing,估計26年下半年會有新的算法做緩存,27年之後應該可以像lora一樣做成外掛的掛上去llm

https://huggingface.co/blog/AtlasCloud-AI/minimax-goes-sparse

#MiniMaxM3 #SparseAttention

MiniMax Goes Sparse: Decoding M3's Attention from a Single Diagram

A Blog post by Atlas Cloud on Hugging Face

MiniMax M3 #minimaxm3

oh mein gott ich bin so aufgeregt =)

https://www.minimax.io/models/text/m3

noch keine preise veröffnetlicht

und nach erstem test: opencode muss noch an der performance arbeiten --- in ein paar tagen passt das bestimmt besser =)

MiniMax M3 - Coding & Agentic Frontier, 1M Context, Multimodal

MiniMax M3 reaches frontier-level performance on coding and agentic tasks, with a 1M context window powered by the MSA architecture and native multimodal understanding. The first open-weight model to unite all three capabilities.

MiniMax

RT @jun_song: TRANSLASION: LLMs kommen diese Woche: Qwen3.7 max ✅ Qwen3.7 27b/35b Minimax M3.0 Gemini 3.5 Pro/Flash GPT-5.6 Sonnet-4.8❓ Kimi/GLM ❓ Es ist eine große Woche.

mehr auf Arint.info

#Gemini3 #GPT5 #KimiGLM #LLMs #MinimaxM3 #Qwen3 #arint_info

https://x.com/jun_song/status/2056644927002701900#m

Arint - SEO+KI (@[email protected])

<p>RT @jun_song: TRANSLASION: LLMs kommen diese Woche: Qwen3.7 max ✅ Qwen3.7 27b/35b Minimax M3.0 Gemini 3.5 Pro/Flash GPT-5.6 Sonnet-4.8❓ Kimi/GLM ❓ Es ist eine große Woche.</p> <p><a href="https://arint.info/@Arint/116600664078049919">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#Gemini3 #GPT5 #KimiGLM #LLMs #MinimaxM3 #Qwen3 #arint_info</p> <p><a href="https://x.com/jun_song/status/2056644927002701900#m">https://x.com/jun_song/status/2056644927002701900#m</a></p>

Mastodon Glitch Edition