RT @LottoLabs: DiffusionGemma 26B-A4B mit llama.cpp-Fork. Dies ist ein gutes Beispiel dafür, wie Diffusionsmodelle einen Textblock parallel im Gegensatz zum nächsten Token generieren. Allerdings muss ich auf bessere Server-Unterstützung für llama.cpp warten oder zu vllm oder ktransformers wechseln, um tatsächliche Auswertungen etc. durchzuführen. Video.
mehr auf Arint.info
#AI #DiffusionGemma #DiffusionModels #ktransformers #llama #vllm #arint_info
<p>RT @LottoLabs: DiffusionGemma 26B-A4B mit llama.cpp-Fork. Dies ist ein gutes Beispiel dafür, wie Diffusionsmodelle einen Textblock parallel im Gegensatz zum nächsten Token generieren. Allerdings muss ich auf bessere Server-Unterstützung für llama.cpp warten oder zu vllm oder ktransformers wechseln, um tatsächliche Auswertungen etc. durchzuführen. Video.</p> <p><a href="https://arint.info/@Arint/116736561324668274">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#AI #DiffusionGemma #DiffusionModels #ktransformers #llama #vllm #arint_info</p> <p><a href="https://x.com/LottoLabs/status/2064920298206728560#m">https://x.com/LottoLabs/status/2064920298206728560#m</a></p>
https://winbuzzer.com/2026/06/11/google-diffusiongemma-trades-quality-for-local-ai-speed-xcxwbn/
Google has introduced DiffusionGemma to speed local AI output through parallel text diffusion, but lower quality than Gemma 4 keeps trade-offs visible.
#AI #DiffusionGemma #TextDiffusion #Google #GoogleAI #AIModels #OpenSourceAI #OnDeviceAI #AIResearch
👀 DiffusionGemma: Google lancia un nuovo modello open source per esecuzione in locale che elabora 256 token in parallelo, usa attention bidirezionale e si auto-corregge in tempo reale.
https://gomoot.com/diffusiongemma-il-nuovo-modello-open-source-di-google/
Google veröffentlicht das Open-Source-Modell DiffusionGemma, das durch parallele Text-Diffusion auf lokalen Grafikkarten die Generierung beschleunigt.
Das 26B-Modell aktiviert 3,8B Parameter pro Abfrage und generiert 256 Token zeitgleich. Auf einer Nvidia RTX 5090 erreicht es über 700 Token/s. Die allgemeine Textqualität liegt jedoch unter der des autoregressiven Gemma-4-Modells.
#DiffusionGemma #Google #HuggingFace #OpenSource #AIGeneratedImage
https://www.all-ai.de/news/news26top/gemma-diffusion-schreiben
Google、専用GPU上で生成速度が最大4倍となる実験モデル「DiffusionGemma」を発表
https://gihyo.jp/article/2026/06/diffusion-gemma?utm_source=feed
RT @googlegemma: Triff DiffusionGemma! Ein experimentelles Open-Source-Modell, das einen schnellen Ansatz zur Textgenerierung erforscht und unter der Apache 2.0-Lizenz veröffentlicht wurde. Es geht über sequenzielle, tokenweise Prozesse hinaus, um ganze Textblöcke gleichzeitig zu generieren. Hier ist, was bei DiffusionGemma neu ist: 👇 Video
mehr auf Arint.info
#Apache20 #DiffusionGemma #KI #MachineLearning #OpenSource #TextGenerierung #arint_info
<p>RT @googlegemma: Triff DiffusionGemma! Ein experimentelles Open-Source-Modell, das einen schnellen Ansatz zur Textgenerierung erforscht und unter der Apache 2.0-Lizenz veröffentlicht wurde. Es geht über sequenzielle, tokenweise Prozesse hinaus, um ganze Textblöcke gleichzeitig zu generieren. Hier ist, was bei DiffusionGemma neu ist: 👇 Video</p> <p><a href="https://arint.info/@Arint/116729478686808060">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#Apache20 #DiffusionGemma #KI #MachineLearning #OpenSource #TextGenerierung #arint_info</p> <p><a href="https://x.com/googlegemma/status/2064741002204545467#m">https://x.com/googlegemma/status/2064741002204545467#m</a></p>