RT @AiBattle_: Das Gemma 4 124B MoE-Modell wird schon seit einiger Zeit gerüchteweise erwartet und wurde sogar von Jeff Dean erwähnt. Ich hoffe, dass es nicht mehr lange dauert, bis es endlich veröffentlicht wird. Nathan Lambert (@natolambert): Befreit das 100B Gemma 4 MoE! Gemini Flash 3.5 ist da, also könnt ihr es jetzt veröffentlichen! — https://nitter.net/natolambert/status/2059389882833994141#m

mehr auf Arint.info

#AI #Gemini #Gemma4 #MachineLearning #MoE #arint_info

https://x.com/AiBattle_/status/2059629633939579004#m

Три попытки обогнать в бенче базовую Gemma 4 дообучением — и все три мимо

Две недели мы пытались обогнать собственную базу. Файнтюном. Потом ещё раз файнтюном на переделанном корпусе. Потом — RAG. Все три раунда база выиграла. Это статья про отрицательный результат. Я считаю, он полезнее победы — потому что воспроизводимый и объясняет, какой инструмент под какую задачу. Дальше — цифры, стек и три разбора «почему не взлетело».

https://habr.com/ru/articles/1040322/

#llm #gemma4 #dora #lora #sft #llmjudge

Три попытки обогнать в бенче базовую Gemma 4 дообучением — и все три мимо

У нас есть открытый бенчмарк https://github.com/csylabs-org/lii-sport-bench-ru для оценки русскоязычных LLM на спортивном домене — ЛИИ-Спорт-Bench-RU, 655 экспертных вопросов по 35 видам спорта. В...

Хабр

New week, more slides: Run LLMs Locally

Now including wllama to run GGUF models inside your browser!

wllama uses llama.cpp, WebAssembly and WebGPU, bringing a completely new experience of LLMs into the web.
It has no 4 GB limitation and is faster than Transformers.js.

I also added translations using the HY-MT model from Tencent.

https://codeberg.org/thbley/talks/raw/branch/main/Run_LLMs_Locally_2026_ThomasBley.pdf

#ai #llm #llamacpp #wllama #stablediffusion #qwen3 #glm #localai #gemma4 #webgpu #opencode #mtp #webassembly

RT @witcheer: Hier ist die Rangliste meiner Benchmarks. Modelle, die ich auf meinem kleinen 8GB-RTX getestet habe. Gemma 4 E4B hat mich sehr überrascht, besonders nach dem Testen anderer Modelle, bei denen ich viele Probleme mit Kontext, Geschwindigkeit, Qualität oder gleichzeitiger Nutzung festgestellt habe. Es ist sehr anständig in Kombination mit Pi.

mehr auf Arint.info

#Benchmark #Gemma4 #Hardware #KI #Pi #RTX8GB #arint_info

https://x.com/witcheer/status/2058459544242565375#m

Arint - SEO+KI (@[email protected])

<p>RT @witcheer: Hier ist die Rangliste meiner Benchmarks. Modelle, die ich auf meinem kleinen 8GB-RTX getestet habe. Gemma 4 E4B hat mich sehr überrascht, besonders nach dem Testen anderer Modelle, bei denen ich viele Probleme mit Kontext, Geschwindigkeit, Qualität oder gleichzeitiger Nutzung festgestellt habe. Es ist sehr anständig in Kombination mit Pi.</p> <p><a href="https://arint.info/@Arint/116633222063321462">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#Benchmark #Gemma4 #Hardware #KI #Pi #RTX8GB #arint_info</p> <p><a href="https://x.com/witcheer/status/2058459544242565375#m">https://x.com/witcheer/status/2058459544242565375#m</a></p>

Mastodon Glitch Edition

RT @googlegemma: Wir betreten eine neue Ära der On-Device-Automatisierung. ✨ Sehen Sie, wie Gemma 4 E4B ein iOS-Simulator direkt mit Argent navigiert und steuert. Lokale Modelle können komplexe Interaktionen und Software-Navigation autonom bewältigen. Video

mehr auf Arint.info

#AutonomousDriving #Gemma4 #iOSAutomation #LocalAI #OnDeviceAutomation #TechInnovation #arint_info

https://x.com/googlegemma/status/2057570113390551452#m

Arint - SEO+KI (@[email protected])

<p>RT @googlegemma: Wir betreten eine neue Ära der On-Device-Automatisierung. ✨ Sehen Sie, wie Gemma 4 E4B ein iOS-Simulator direkt mit Argent navigiert und steuert. Lokale Modelle können komplexe Interaktionen und Software-Navigation autonom bewältigen. Video</p> <p><a href="https://arint.info/@Arint/116627558895783388">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#AutonomousDriving #Gemma4 #iOSAutomation #LocalAI #OnDeviceAutomation #TechInnovation #arint_info</p> <p><a href="https://x.com/googlegemma/status/2057570113390551452#m">https://x.com/googlegemma/status/2057570113390551452#m</a></p>

Mastodon Glitch Edition

RT @googlegemma: TRANSLASATION: Wir betreten eine neue Ära der On-Device-Automatisierung. ✨ Sehen Sie, wie Gemma 4 E4B ein iOS-Simulator direkt mit Argent navigiert und steuert. Lokale Modelle können komplexe Interaktionen und Software-Navigation autonom bewältigen. Video

mehr auf Arint.info

#Argent #AutonomousNavigation #Gemma4 #iOSAutomation #LocalAI #OnDeviceAutomation #arint_info

https://x.com/googlegemma/status/2057570113390551452#m

Arint - SEO+KI (@[email protected])

<p>RT @googlegemma: TRANSLASATION: Wir betreten eine neue Ära der On-Device-Automatisierung. ✨ Sehen Sie, wie Gemma 4 E4B ein iOS-Simulator direkt mit Argent navigiert und steuert. Lokale Modelle können komplexe Interaktionen und Software-Navigation autonom bewältigen. Video</p> <p><a href="https://arint.info/@Arint/116616234935329505">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#Argent #AutonomousNavigation #Gemma4 #iOSAutomation #LocalAI #OnDeviceAutomation #arint_info</p> <p><a href="https://x.com/googlegemma/status/2057570113390551452#m">https://x.com/googlegemma/status/2057570113390551452#m</a></p>

Mastodon Glitch Edition

NobodyWho now supports #Swift 🎉

Run #LLMs fully on-device in your #iOS, #macOS, #watchOS & #visionOS apps. No internet. No API keys. No usage fees.

#Gemma4, #Qwen & more (.gguf)
→ Hardware acceleration
→ Tool calling, #RAG, vision & audio ingestion
→ Open-source & free

https://github.com/nobodywho-ooo/nobodywho

New week, new slides: Run LLMs Locally

Now including multi-token prediction using Qwen3.6 35B-A3B with Nextn quantization. Also speech recognition using Qwen-3-ASR is now working directly with Llama.cpp and included in the slides.

https://codeberg.org/thbley/talks/raw/branch/main/Run_LLMs_Locally_2026_ThomasBley.pdf

#ai #llm #llamacpp #stablediffusion #qwen3 #glm #localai #gemma4 #webgpu #opencode #mtp

Total failure on getting a route station to station on London Underground by Gemma 😆 Local AI in the phone needs improvement. #AI #gemma4