RT @ArtificialAnlys: NVIDIA hat im Rahmen der Computex-Schlüsselrede von Jensen Huang die Veröffentlichung von Nemotron 3 Ultra angekündigt: Mit 550 Milliarden Parametern (55 Milliarden aktiv) ist dies das größte Nemotron-3-Modell bis dato und das intelligenteste US-amerikanische Modell mit offenen Gewichten.

mehr auf Arint.info

#AI #Computex #LLM #Nemotron3 #NVIDIA #OpenWeights #arint_info

https://x.com/ArtificialAnlys/status/2061304911565144230#m

Arint - SEO+KI (@[email protected])

<p>RT @ArtificialAnlys: NVIDIA hat im Rahmen der Computex-Schlüsselrede von Jensen Huang die Veröffentlichung von Nemotron 3 Ultra angekündigt: Mit 550 Milliarden Parametern (55 Milliarden aktiv) ist dies das größte Nemotron-3-Modell bis dato und das intelligenteste US-amerikanische Modell mit offenen Gewichten.</p> <p><a href="https://arint.info/@Arint/116678590202093885">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#AI #Computex #LLM #Nemotron3 #NVIDIA #OpenWeights #arint_info</p> <p><a href="https://x.com/ArtificialAnlys/status/2061304911565144230#m">https://x.com/ArtificialAnlys/status/2061304911565144230#m</a></p>

Mastodon Glitch Edition

RT @jumperz: MiniMax m3 ist wahnsinnig und hat die eine Regel gebrochen, der jedes KI-Modell gefolgt ist: Bessere Kosten = bessere Fähigkeiten... Wenn man alle Modelle in ein Diagramm einträgt, mit den Kosten auf der einen und der Qualität auf der anderen Seite, fallen sie alle entlang einer geraden Linie... Günstige / schwächere Modelle sitzen unten links, teure / stärkere oben rechts... Du zahlst mehr, du bekommst mehr, einfach so... Stell dir eine Diagonale vor, die von günstig und schwach (unten links) zu teuer und stark (oben rechts) verläuft... Diese Linie ist der übliche Preis dafür, wie viel Leistung dein Geld kauft... Jedes Modell zahlt diesen Preis... Als m3 das erste ist, das mehr bekommt, als es bezahlt hat, und sich über der Linie positioniert, wo noch nie etwas war... ist es so leistungsfähig wie die Modelle der mittleren Frontier-Klasse, aber zum Preis der günstigsten Modelle mit $1.20... Und der größere Teil ist, dass m3 Open-Weights hat, also ist zum ersten Mal das beste Preis-Leistungs-Verhältnis im Diagramm auch das, das du vollständig besitzt.. MiniMax (offiziell) (@MiniMaxAI) Vorstellung von MiniMax M3: Das erste Open-Weights-Modell, das drei Frontier-Fähigkeiten kombiniert - Coding & Agentic Frontier: 59.0% SWE-Bench Pro, 66.0% Terminal Bench 2.1, 34.8% SWE-fficiency, 28.8% KernelBench Hard, 74.2% MCP Atlas - MiniMax Sparse Attention skaliert den Kontext auf 1M - Nativ Multimodal von Schritt Null API: platform.minimax.io Token-Plan: platform.minimax.io/subscrib… 🚀Neu! MiniMax Code: code.minimax.io Gewichte & Tech-Bericht in ~10 Tagen — https://nitter.net/MiniMaxAI/…

mehr auf Arint.info

#AIInnovation #KIModell #MachineLearning #MiniMaxM3 #OpenWeights #TechNews #arint_info

https://x.com/jumperz/status/2061376241572151513#m

Die API-Preise der neuen Modelle GPT-5.5, Claude Opus 4.7 und Gemini 3.5 Flash verschleiern durch geänderte Tokenizer und interne Denkprozesse die wahren Betriebskosten.

GPT-5.5 verursacht effektive Kostensteigerungen von 49 bis 92 Prozent. Gemini 3.5 Flash erzeugt im Hintergrund permanente Thinking-Tokens, wodurch Benchmarks über 1.500 US-Dollar kosten.

#LLM #OpenWeights #GPT5 #GeminiFlash #AIGeneratedImage

https://www.all-ai.de/news/beitrage2026/kosten-ki-modell-real-1

Versteckte Kosten bei neuen KI Modellen aufgedeckt

Die offiziellen Preise bei OpenAI, Anthropic und Googel können täuschen. Neue Tokenizer und Denkprozesse treiben die echten Kosten in die Höhe.

all-ai.de
MiniCPM5-1B Shows Why the Small-Model Race Isn't Over - Firethering

A 1B model scoring 40.42 on AIME 2025 should not be possible. AIME is the American Invitational Mathematics Examination, the kind of test that filters out most humans who attempt it. Qwen3-0.6B scores 16.25 on the same benchmark. LFM2.5-1.2B, a larger model, scores 31.88. MiniCPM5-1B, at roughly one billion parameters, beats both. OpenBMB just dropped MiniCPM5-1B, the first model in their MiniCPM5 series, and it's built specifically for the scenarios like on-device deployment, resource-constrained environments, local inference on consumer hardware. The AIME score is surprising. The telecom agent benchmark is even more surprising. And then there's the desktop pet. We'll get to that.

Firethering

Absolutely TRUE!!!

"If a credible Western open frontier player does not emerge, the consequences cascade quickly.

This is the inverse of the early Internet wave. In the 2000s and 2010s, Western companies — Google, Facebook, Amazon, Apple, Microsoft — dominated globally while China carved out its own walled garden. The AI version flips that dynamic on its head. Without a credible Western open frontier player, the only open models capable of running entire economies are made in China. If U.S. policy further restricts Chinese open-weight access on national-security grounds, the U.S. ends up with two or three closed Cathedrals serving the U.S. market — and the rest of the world picks the AI stack that is free, capable, self-hostable, and not embargoed. Europe, Africa, Southeast Asia, Latin America, India, the Middle East. Roughly six billion people. Chinese open models become the global default by 2030, and the United States ends up technologically isolated from the majority of the world’s AI users. We would have done it to ourselves.

Watch what happens to AI infrastructure over the next twenty-four months. And watch Washington just as carefully.

Open source is no longer just how good software gets built. It is how dominant incumbents get neutralized, how trillion-dollar industries shift their power structure, and how the next generation of strategic moats gets dug — by the companies smart enough to dig them in the open."

https://p3institute.substack.com/p/from-open-source-software-to-open?source=queue

#OpenSource #FLOSS #China #AI #USA #GenerativeAI #OpenWeights #LLMs

From Open Source Software to Open Source Strategy

How the Smartest Executives Are Using Open Source Techniques to Optimize Corporate Strategy

Bill's Substack

Разбираю «Qwen3.5-21B-Claude-4.6-Opus-Heretic-Uncensored»: что на самом деле внутри файнтюна с громким именем

В телеграме завирусился пост: якобы кто-то “дообучил Qwen 3.5 до уровня Claude 4.6 Opus и убрал цензуру через Heretic”. Я открыл карточку модели на HuggingFace и провёл вечер, разбираясь, что под капотом. Спойлер: там много интересной техники, но к Claude эта модель имеет такое же отношение, как кроссовки “Adibas” к Adidas. Разбираю distillation, depth upscaling и abliteration без маркетинговой обёртки.

https://habr.com/ru/articles/1032324/

#LLM #Qwen #abliteration #файнтюн #HuggingFace #distillation #intepretability #openweights

Разбираю «Qwen3.5-21B-Claude-4.6-Opus-Heretic-Uncensored»: что на самом деле внутри файнтюна с громким именем

Технический разбор модели, которую в телеграме продают как «Claude без цензуры» В моей ленте недавно завирусился пост: якобы кто-то «дообучил Qwen 3.5 до уровня Claude 4.6 Opus, убрал цензуру через...

Хабр

Mistral AI veröffentlicht Mistral Medium 3.5 mit 128 Milliarden Parametern, 256.000 Token Kontext und asynchronen Remote Agents für Coding-Aufgaben.

Das Modell läuft auf vier GPUs und ist On-Premise hostbar. Open Weights stehen unter einer modifizierten MIT-Lizenz bereit. In Benchmarks wie SWE-Bench Verified (77,6%) übertrifft es Claude Sonnet 4.5.

#Mistral #LLM #OpenWeights #MistralAI #AIGeneratedImage

https://www.all-ai.de/news/news26top/mistral-medium-3-5-flagschiff

Mistral Medium 3.5 kann länger

Das neue Flaggschiff-Modell vereint Reasoning und Coding bei geringen Hardware-Anforderungen für den Enterprise-Einsatz.

All-AI.de
The Moat or the Commons — Warman Notes

American capital financed AI on the assumption it would be the next great monopoly. Open-weight models are commoditizing the capability that monopoly was supposed to protect. The collision between the two now defines the direction of the U.S. AI industry — and the country.

It's happening: "Open Weights" LLMs are becoming way better and the gap between them and proprietary models is fastly closing :)
https://artificialanalysis.ai/#artificial-analysis-intelligence-index-by-open-weights-proprietary

#AI #GenerativeAI #LLMs #OpenWeights #China

DeepSeek veröffentlicht die neuen Modelle V4-Pro und V4-Flash mit einem Kontextfenster von einer Million Token.

Durch den Einsatz von Compressed Sparse Attention und Heavily Compressed Attention sinkt der Rechenbedarf bei langen Eingaben deutlich. V4-Pro aktiviert 49 Milliarden Parameter pro Token. Das Training erfolgte erfolgreich auf Huawei Ascend NPUs.

#DeepSeek #KI #MoE #OpenWeights #News
https://www.all-ai.de/news/news26top/deepseek-4-test

DeepSeek 4.0 mit neuem »DeepSeek-Moment«?

Mit der V4-Serie verringert das Unternehmen den Speicherbedarf massiv und unterstützt nun auch chinesische Huawei-Chips.

All-AI.de