RT @ItsmeAjayKV: Update zum @googlegemma Gemma4 12B-Lauf. Jetzt mit MTP. Ich habe @UnslothAI's neues Gemma 4 12B MTP-Draft-Modell (gemma-4-12B-it-MTP-Q80.gguf) auf meiner RTX 3060 12GB benchmarked. Die Ergebnisse sind folgende. MTP führte zu: • Schnellere Dekodiergeschwindigkeit (+12% bis +37%) • Langsameres Prefill (-10% bis -15%) • Schlechtere TTFT (+11% bis +16%) Größter Gewinn: 32K Kontext 29,9 tok/s → 41,1 tok/s Das entspricht einer Steigerung der Generierungsdurchsatzrate um 37%. AJ (@ItsmeAjayKV) Habe meine ersten Benchmarks für @googlegemma Gemma 4 12B auf meiner 12GB RTX 3060 mit @UnslothAI GGUFs abgeschlossen. Die Ergebnisse sind ehrlich gesagt ziemlich beeindruckend. llama.cpp CUDA, Standard-Decoding (ohne MTP) 4K Kontext, Flash Attention aktiviert, q8 KV-Cache. Q5KXL - 1152 tok/s Prefill - 33,3 tok/s Generierung - ~9,3GB VRAM Q6KXL - 1113 tok/s Prefill - 26,0 tok/s Generierung - ~11,3GB VRAM Q80 mit -ngl 40 partieller Auslagerung - 986 tok/s Prefill - 14,9 tok/s Generierung - ~11,2GB VRAM - Nur 40/48 Schichten ausgelagert Für alle, die sich fragen, ob eine 12GB 3060 für lokale KI im Jahr 2026 noch relevant ist: absolut ja. Q5KXL fühlt sich hier besonders wie der ideale Kompromiss an. Weitere Tests folgen. — https://nitter.net/ItsmeAjayKV/status/2062542245719572577#m

mehr auf Arint.info

#Benchmarking #Gemma4 #LLM #LocalAI #RTX3060 #UnslothAI #arint_info

https://x.com/ItsmeAjayKV/status/2062976512408842510#m

RT @ItsmeAjayKV: Update zum @googlegemma Gemma4 12B-Lauf. Jetzt mit MTP. Ich habe @UnslothAI's neues Gemma 4 12B MTP-Entwurfsmodell (gemma-4-12B-it-MTP-Q80.gguf) auf meiner RTX 3060 12GB benchmarked. Die Ergebnisse sind wie folgt. MTP führte zu: • Schnellere Decodierungsgeschwindigkeit (+12% bis +37%) • Langsameres Prefill (-10% bis -15%) • Schlechtere TTFT (+11% bis +16%) Größter Gewinn: 32K Kontext 29.9 tok/s → 41.1 tok/s Das entspricht einer Steigerung der Generierungsdurchsatzrate um 37%. AJ (@ItsmeAjayKV) Beendete meine ersten Benchmarking-Tests für @googlegemma Gemma 4 12B auf meinem 12GB RTX 3060 unter Verwendung von @UnslothAI GGUFs. Die Ergebnisse sind ehrlich gesagt ziemlich beeindruckend. llama.cpp CUDA, Standard-Decodierung (ohne MTP) 4K Kontext, Flash Attention aktiviert, q8 KV-Cache. Q5KXL - 1152 tok/s Prefill - 33.3 tok/s Generierung - ~9.3GB VRAM Q6KXL - 1113 tok/s Prefill - 26.0 tok/s Generierung - ~11.3GB VRAM Q80 mit -ngl 40 partielle Auslagerung - 986 tok/s Prefill - 14.9 tok/s Generierung - ~11.2GB VRAM - Nur 40/48 Schichten ausgelagert Für alle, die sich fragen, ob ein 12GB 3060 für lokale KI im Jahr 2026 noch relevant ist: absolut ja. Q5KXL fühlt sich hier besonders als der ideale Kompromiss an. Weitere Tests folgen. — https://nitter.net/ItsmeAjayKV/status/2062542245719572577#m

mehr auf Arint.info

#Benchmarking #Gemma4 #LLM #LocalAI #RTX3060 #UnslothAI #arint_info

https://x.com/ItsmeAjayKV/status/2062976512408842510#m

RT @ItsmeAjayKV: Update zum @googlegemma Gemma4 12B-Lauf. Jetzt mit MTP. Ich habe das neue Gemma 4 12B MTP-Draft-Modell von @UnslothAI (gemma-4-12B-it-MTP-Q80.gguf) auf meiner RTX 3060 12GB benchmarkt. Die Ergebnisse sind wie folgt. MTP führte zu: • Schnellere Dekodiergeschwindigkeit (+12% bis +37%) • Langsameres Prefill (-10% bis -15%) • Schlechtere TTFT (+11% bis +16%) Größter Gewinn: 32K-Kontext 29,9 tok/s → 41,1 tok/s Das entspricht einer 37%igen Steigerung der Generierungsdurchsatzleistung. AJ (@ItsmeAjayKV) Ich habe meine ersten Benchmarktests für @googlegemma Gemma 4 12B auf meiner 12GB RTX 3060 mit @UnslothAI GGUFs abgeschlossen. Die Ergebnisse sind ehrlich gesagt ziemlich beeindruckend. llama.cpp CUDA, Standard-Decoding (ohne MTP), 4K-Kontext, Flash Attention aktiviert, q8 KV-Cache. Q5KXL - 1152 tok/s Prefill - 33,3 tok/s Generierung - ~9,3GB VRAM Q6KXL - 1113 tok/s Prefill - 26,0 tok/s Generierung - ~11,3GB VRAM Q80 mit -ngl 40 partieller Auslagerung - 986 tok/s Prefill - 14,9 tok/s Generierung - ~11,2GB VRAM - Nur 40/48 Schichten ausgelagert Für alle, die sich fragen, ob eine 12GB 3060 für lokale KI im Jahr 2026 noch relevant ist: auf jeden Fall ja. Q5KXL fühlt sich hier besonders als der ideale Kompromiss an. Weitere Tests folgen. — https://nitter.net/ItsmeAjayKV/status/2062542245719572577#m

mehr auf Arint.info

#Benchmarking #Gemma4 #LLM #LocalAI #RTX3060 #UnslothAI #arint_info

https://x.com/ItsmeAjayKV/status/2062976512408842510#m

Arint - SEO+KI (@[email protected])

<p>RT @LeTechLead: RTX 3060 (12 GB) Benchmarks:</p> <p><a href="https://arint.info/@Arint/116634636261685499">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#AI #Benchmarks #Hardware #LLM #qwen3 #RTX3060 #arint_info</p> <p><a href="https://x.com/LeTechLead/status/2058692434834399655#m">https://x.com/LeTechLead/status/2058692434834399655#m</a></p>

Mastodon Glitch Edition
ZOTAC Gaming GeForce RTX 3060 Twin Edge OC 12GB GDDR6 192-bit 15Gbps PCIE 4.0 Gaming Graphics Card, IceStorm 2.0 Cooling, Active Fan Control, Freeze Fan Stop ZT-A30600H-10M: Amazon.de: Toys

ZOTAC Gaming GeForce RTX 3060 Twin Edge OC 12GB GDDR6 192-bit 15Gbps PCIE 4.0 Gaming Graphics Card, IceStorm 2.0 Cooling, Active Fan Control, Freeze Fan Stop ZT-A30600H-10M: Amazon.de: Toys

100 美元超舊卡 NVIDIA V100 行 AI 效能實測 竟快過 RTX 3060
  NVIDIA V100 跑 LLM 實測結果意外勝過多張消費級顯示卡。Hardware Have […]
#人工智能 #評測 #LLM #NVIDIA
https://unwire.hk/2026/05/11/v100-llm-test-results/ai/?utm_source=rss&utm_medium=rss&utm_campaign=v100-llm-test-results
Efsane geri dönüyor! 🚀 Nvidia, RTX 50 serisindeki stok sorunlarını aşmak için RTX 3060 12GB modelini yeniden üretim bandına aldı. Temmuz'da raflarda! Detaylar ve beklenen Türkiye fiyatı haberimizde. 👇 https://teknohaberi.net/rtx-3060-12gb-geri-donuyor-cikis-tarihi/ #Nvidia #RTX3060 #Gaming
RTX 3060 12GB Temmuz’da Dönüyor: 1080p İçin Yeni Stok

Nvidia, ekran kartı pazarında taşları yerinden oynatacak stratejik bir hamleyle efsaneleşen RTX 3060 12GB modelini Temmuz 2026'da yeniden piyasaya sürmeye hazırlanıyor. RTX 50 serisindeki stok darboğazı ve RTX 5050 modelinin ertelenmesi, şirketi Ampere mimarisinin bu popüler modeline yöneltti. Teknik tarafta Haziran ayında başlayacak yeni üretim süreciyle birlikte MSI, ASUS ve Colorful gibi devlerin rafları yeniden

Güncel Teknoloji Haberleri
Efter en lång period av rykten sägs Nvidias grafikkort Geforce RTX 3060 12 GB nu vara cirka två månader ifrån sin officiella återlansering.#ampere #geforce #gpu #grafikkort #Nvidia #RTX3060 #samsung
Geforce RTX 3060 12 GB sägs närma sig återlansering
Geforce RTX 3060 12 GB sägs närma sig återlansering

Efter en lång period av rykten sägs Nvidias grafikkort Geforce RTX 3060 12 GB nu vara cirka två månader ifrån sin officiella återlansering.

Nordichardware
Eine entstehende Marktlücke bei günstigen #Grafikkarten aufgrund einer Verspätung der #GeForce #RTX5050 stopft #Nvidia angeblich mit einer #Neuauflage der #RTX3060. Das hätte für Käufer Vor- und Nachteile. https://winfuture.de/news,158166.html?utm_source=Mastodon&utm_medium=ManualStatus&utm_campaign=SocialMedia
Nvidia mit Plan B: RTX 5050 verzögert sich, RTX 3060 soll Lücke füllen

Nvidia plant angeblich eine überraschende Rückkehr auf dem Grafikkartenmarkt. Weil sich die RTX 5050 wohl verzögert, soll im Juni die RTX 3060 die Lücke füllen. Das würde für preisbewusste Käufer sowohl Vor- als auch Nachteile mit sich bringen.

WinFuture.de