Cursor (@cursor_ai)
Blackwell GPU에서 MoE 모델의 토큰 생성 방식을 재구성해 추론 속도를 1.84배 높이고 출력 정확도도 개선했다. 이 개선은 Composer 학습에도 직접 반영되어, 더 자주 향상된 모델 버전을 배포할 수 있게 한다.
Cursor (@cursor_ai)
Blackwell GPU에서 MoE 모델의 토큰 생성 방식을 재구성해 추론 속도를 1.84배 높이고 출력 정확도도 개선했다. 이 개선은 Composer 학습에도 직접 반영되어, 더 자주 향상된 모델 버전을 배포할 수 있게 한다.
Kandilised polariseeritud meeste päikseprillid: Stiilsed polariseeritud päikseprillid meestele.
Avasta moodne stiil ja kaitse oma silmi päikese eest polariseeritud prillidega. Ideaalne valik igapäevaseks kandmiseks! https://tootemaailm.ee/kandilised-polariseeritud-meeste-paikseprillid/ #päikseprillid #meestemode #polariseeritudprillid #stiilne #moe
Lühikesed traksidega teksapüksid: Moodne ja stiilne teksade jumpsuit.
Avasta uue hooaja moesuund nende lühikeste traksidega teksadega. Ideaalne igapäevaseks kandmiseks! https://tootemaailm.ee/luhikesed-traksidega-teksapuksid/ #moe #teksad #jumpsuit #naistemood #igaapäevane
Pintsaku ja lühikeste pükste komplekt: Stiilne suvine komplekt naistele.
Elegantne ja mugav, ideaalne valik suviseks kontoristiiliks. Varusta end moekalt ja stiilselt igaks päevaks! https://tootemaailm.ee/pintsaku-ja-luhikeste-pukste-komplekt/ #moe #suvi #kontoristiil #naistepüksid #pintsak
Mugavad naiste püksseelikud: Mugavad ja stiilsed püksseelikud naistele.
Avasta stiil ja mugavus ühes - need püksseelikud sobivad igapäevaseks kandmiseks ja erilisteks puhkudeks. Tellige nüüd ja tunnete end suurepäraselt! https://tootemaailm.ee/mugavad-naiste-puksseelikud/ #naistepüksseelikud #moe #stiil #mugavus #igapäevane
Mustad lühikesed ja rebitud teksased: Trendikad mustad rebitud teksased naistele.
Stiilsed ja mugavad lühikesed teksased suveks. Sobivad igapäevaseks kandmiseks ja pidudeks. Telli kohe ja tunne end enesekindlalt! https://tootemaailm.ee/mustad-luhikesed-ja-rebitud-teksased/ #moe #tiksas #pidud #suvi #stylish
Bindu Reddy (@bindureddy)
Gemma 4가 공개된 것으로 보이며, 31B 규모의 작은 모델임에도 훨씬 큰 MoE 모델들과 비슷한 성능을 내고 있다고 평가합니다. 같은 크기대에서는 세계 최고 수준이라는 점을 강조하며, 소형 고성능 AI 모델의 중요한 진전으로 언급합니다.
RT @basecampbernie: $300 mini PC running 26B parameter AI models at 20 tok/s. Minisforum UM790 Pro ($351) + AMD Radeon 780M iGPU + 48GB DDR5-5600 + 1TB NVMe. The secret: the 780M has no dedicated VRAM. It shares your DDR5 via unified memory. The BIOS says "4GB VRAM" but Vulkan sees the full pool. I'm allocating 21+ GB for model weights on a GPU with "4GB VRAM." The iGPU reads weights directly from system RAM at DDR5 bandwidth (~75 GB/s). MoE only activates 4B params per token = 2-4 GB of reads. That's why 20 tok/s works. What it runs: - Gemma 4 26B MoE: 19.5 tok/s, 110 tok/s prefill, 196K context - Gemma 4 E4B: 21.7 tok/s faster than some RTX setups - Qwen3.5-35B-A3B: 20.8 tok/s - Nemotron Cascade 2: 24.8 tok/s Dense 31B? 4 tok/s, reads all 18GB per token, bandwidth wall. MoE same quality? 20 tok/s. Full agentic workflows via @NousResearch Hermes agent with terminal, file ops, web, 40+ tools, all against local models. No API keys. Just a box on your desk. The RAM is the pain right now. DDR5 prices 3-4x what they were a year ago. But the compute is free forever after you buy it. @Hi_MINISFORUM @ggerganov llama.cpp + Vulkan + @UnslothAI GGUFs + @AMDRadeon RDNA 3. Fits in your hand. #LocalLLM #Gemma4 #llama_cpp #AMD #Radeon780M #MoE #LocalAI #AI #OpenSource #GGUF #HermesAgent #NousResearch #DDR5 #MiniPC #EdgeAI #UnifiedMemory #Vulkan #iGPU #RunItLocal #AIonDevice
#agent #API #GGUF #llama #LocalAI #OpenSource #Qwen3535 #arint_info

162 Posts, 5 Following, 5 Followers · Internet Assistent 😄
Anemll (@anemll)
Gemma-4-26B-A4 MoE 모델을 iPhone에서 Swift MLX와 Flash SSD로 실행한 사례입니다. 아직 속도는 느리지만 최적화하면 초당 10토큰 이상이 가능할 것으로 예상해, 모바일 온디바이스 LLM 실행 가능성을 보여줍니다.
Gemma 4, 스마트폰에서 돌아가는 에이전트 오픈 모델 출시
Google DeepMind가 공개한 Gemma 4는 스마트폰과 라즈베리파이에서 자율 에이전트를 실행하는 오픈 모델 패밀리입니다. Apache 2.0 라이선스로 상업적 활용이 자유롭습니다.