Why AI token prices are about to plummet

Nvidia's Blackwell systems could flood the market with cheap AI tokens, driving down costs and reshaping the economics of AI.

https://www.businessinsider.com/ai-token-price-crash-nvidia-blackwell-gpus-2026-6

#TopNews #News #AI #Blackwell #SemiAnalysis

How #DylanPatel and #SemiAnalysis Grabbed Sway in #SiliconValley
29-year-old has adeptly navigated blurred lines between media, tech and investing, turning himself into a hybrid of all three
Patel has no time for journalistic pieties and those who come to see SemiAnalysis as industry bible don’t mind his laissez-faire attitude. He positioned firm as leading experts on #AI, which had few such experts a few years ago—colorful commentators on a realm ballooning in importance
https://www.theinformation.com/articles/dylan-patel-semianalysis-grabbed-sway-silicon-valley
How Dylan Patel and SemiAnalysis Grabbed Sway in Silicon Valley

For Dylan Patel, founder of SemiAnalysis, an influential AI industry newsletter and research firm, Nvidia deserves the kind of dogged observation and study the tabloid press once devoted to Princess Diana. Hescrutinizesthe chip giant’s new products,documentsits delays andscoopsdetails about its ...

The Information

Trening modelu DeepSeek nie kosztował 6 mln dolarów, lecz 1,3 miliarda dolarów – raport SemiAnalysis

Chińska sztuczna inteligencja: DeepSeek mocno zamieszała w branży AI. Jednym z szokujących twierdzeń chińskich twórców tego modelu są deklarowane przez nich znikome, w stosunku do innych modeli AI, koszty szkolenia. Szkoda tylko, że podane kwoty mocno rozmijają się z prawdopodobnym stanem faktycznym.

SemiAnalysis to niezależna firma badawcza i analityczna specjalizująca się w branży półprzewodników i sztucznej inteligencji (AI). Oferuje dogłębną analizę całego łańcucha dostaw, od produkcji półprzewodników po najnowsze modele AI, oprogramowanie i infrastrukturę. I właśnie eksperci z tej organizacji wzięli na warsztat analizę faktycznych kosztów treningu najnowszego chińskiego modelu sztucznej inteligencji.

Wnioski? Pokrywają się z przypuszczeniami tych, którzy od początku ogłoszenia DeepSeek przez chiński podmiot wątpili w deklarowane przez twórców koszty treningu nowego modelu. Przypomnijmy, że Chińczycy deklarowali iż wytrenowanie DeepSeek kosztowało ok. 6 mln dolarów. Eksperci SemiAnalysis twierdzą, że to tak, jakby wskazać część materiałów tworzących jakiś produkt i przypisać ją jako całkowity koszt wytworzenia danego produktu. Kwota 6 mln dolarów to ich zdaniem koszt wstępnego szkolenia, co jednocześnie stanowi bardzo wąską część całkowitego kosztu budowy tak rozbudowanego modelu AI jak DeepSeek.

Przede wszystkim eksperci zwracają uwagę, że DeepSeek to nie jest firma istniejąca od wczoraj, lecz organizacja, która przez lata gromadziła środki i potencjał do rozwijania prowadzonych przez nią działań. Kilka lat temu kontrola eksportu półprzewodników ze Stanów Zjednoczonych była znacznie mniej szczelna niż obecnie, to najprawdopodobniej pozwoliło chińskiemu podmiotowi zgromadzić potencjał obliczeniowy, którego koszt całkowicie pominięto w owych deklarowanych przez Chińczyków kosztach szkolenia.

Zdaniem SemiAnalysis wykluczono ważne elementy układanki, takie jak badania i rozwój oraz TCO (całkowity koszt posiadania – Total Cost of Ownership) samego sprzętu. Dla porównania, szkolenie Claude 3.5 Sonnet, modelu zbudowanego przez Anthropic, kosztowało dziesiątki milionów USD, a gdyby to był całkowity koszt potrzebny Anthropic, firma ta nie pozyskałaby miliardów dolarów inwestycji od Google i dziesiątek miliardów od Amazon. Sam trening to nie wszystko, budowa AI to również eksperymenty, opracowywanie nowych architektur, gromadzenie i czyszczenie danych przeznaczonych do treningu sztucznej inteligencji, koszty utrzymania mocy obliczeniowej, energii, lokalizacji, pensje dla pracowników i cała masa innych elementów stanowiących faktyczny, całkowity koszt budowy danego rozwiązania.

SemiAnalysis zwraca uwagę na jeszcze jedną istotną rzecz: DeepSeek V3 jest ich zdaniem niewątpliwie imponującym pod wieloma względami modelem, porównywanym np. do GPT-4o od OpenAI. Jednak trzeba pamiętać, że wykorzystywany dziś GPT-4o to model, który został udostępniony w maju 2024 roku, ponad pół roku temu. W rozwoju sztucznej inteligencji to dużo czasu, biorąc pod uwagę tempo tego rozwoju. Dlatego dobrze jest zachować odpowiednią perspektywę.

Jakoś nikt specjalnie nie zachwyca się istniejącymi już dziś modelami, które są w stanie działać lokalnie i mogą być wytrenowane i uruchomione nawet na dobrze wyposażonym laptopie, a oferują potencjał porównywalny z GPT-3, modelem, którego koszt treningu wymagał całych centrów danych, olbrzymiej mocy i znacznych nakładów. Finalnie SemiAnalysis oszacowało faktyczny koszt wytworzenia DeepSeek na poziomie ok. 1,6 miliarda dolarów. To trochę większa kwota od deklarowanej przez Chińczyków, prawda?

Wszystkich zainteresowanych odsyłam do źródła, raportu SemiAnalysis, który w znacznie bardziej szczegółowy sposób wyjaśnia meandry związane z faktycznymi kosztami treningu modeli zależnie od ich efektów działania.

#AI #DeepSeek #kosztTreninguAI #news #SemiAnalysis #sztucznaInteligencja

DeepSeek Debates: Chinese Leadership On Cost, True Training Cost, Closed Model Margin Impacts

The DeepSeek Narrative Takes the World by Storm DeepSeek took the world by storm. For the last week, DeepSeek has been the only topic that anyone in the world wants to talk about. As it currently s…

SemiAnalysis

An in-depth analysis from SemiAnalysis argues that AI scaling laws have remained robust through innovations like reasoning models and synthetic data, questioning the idea of a wall of diminishing returns. #ai #genai #llms #openai #semianalysis @semianalysis

https://winbuzzer.com/2024/12/12/semianalysis-no-ai-scaling-isnt-slowing-down-xcxwbn/

Always impressed with the technical details in articles on the semianalysis website, this time about "Scaling Laws – O1 Pro Architecture, Reasoning Training Infrastructure, Orion and Claude 3.5 Opus “Failures”
https://semianalysis.com/2024/12/11/scaling-laws-o1-pro-architecture-reasoning-infrastructure-orion-and-claude-3-5-opus-failures/
#infrastructure #architecture #AI #semianalysis #ICT
Scaling Laws – O1 Pro Architecture, Reasoning Training Infrastructure, Orion and Claude 3.5 Opus “Failures”

There has been an increasing amount of fear, uncertainty and doubt (FUD) regarding AI Scaling laws. A cavalcade of part-time AI industry prognosticators have latched on to any bearish narrative the…

SemiAnalysis

Empfehung: SemiAnalysis.com -> Newsletter, wie üblich Freemium (die ersten paar Seiten gibts umsonst. Ich lesen nur diese.)

#semicon #semianalysis #furtherreading

Great blog with amazing in-depth articles on technical subjects with regard to AI and IT.
https://www.semianalysis.com/
#IT #ICT #AI #semianalysis
SemiAnalysis | Dylan Patel | Substack

Bridging the gap between the world's most important industry, semiconductors, and business. Click to read SemiAnalysis, by Dylan Patel, a Substack publication with hundreds of thousands of subscribers.

"The Memory Wall: Past, Present, and Future of DRAM" , excellent and detailled article on DRAM, i learned a lot 😀
Interesting that it doesn't scale anymore, in this time of AI, that must give some headaches.
https://www.semianalysis.com/p/the-memory-wall
#ICT #memory #RAM #DRAM #scaling #IT #semianalysis
The Memory Wall: Past, Present, and Future of DRAM

Winners & Losers in the 3D DRAM Revolution

SemiAnalysis

#Google #AI #インフラストラクチャ の優位性: #マイクロアーキテクチャ よりも #システム が重要」: semianalysis

Google の AI 戦略について、詳しく解説しています。私はとてもついていけませんが、紹介します。

AIの分野で、本当に #Microsoft が勝つのか?少々疑問になって来ました。

https://www.semianalysis.com/p/google-ai-infrastructure-supremacy

#prattohome #semianalysis

Google AI Infrastructure Supremacy: Systems Matter More Than Microarchitecture

From DLRM to LLM, internal workloads win, but how does Google fare in external workloads?

SemiAnalysis
#WorthReading from #SemiAnalysis
This is from mid last year but gets into #GPUrich vs #GPUPoor, what that means for technology/market development and Google vs NVIDIA.
https://bit.ly/4annZkS
Google Gemini Eats The World – Gemini Smashes GPT-4 By 5X, The GPU-Poors

Compute Resources That Make Everyone Look GPU-Poor

SemiAnalysis