Sudo su (@sudoingX)
Gemma 4 31B dense q4_k_m를 RTX 5090 모바일 24GB가 탑재된 ROG Scar 18에서 구동한 성능 후기다. VRAM 거의 전체를 사용하면서 GPU가 99%로 고정됐고, 초당 15토큰을 지속적으로 처리해 모바일 GPU에서도 고성능 로컬 LLM 실행 가능성을 보여준다.

Sudo su (@sudoingX) on X
this thing roars now dude. gemma 4 31b dense q4_k_m on the rtx 5090 mobile 24gb in the rog scar 18, vram at 22.7 of 23.9, gpu locked at 99 percent, 15 tokens per second sustained while i type this. on perf mode fans sound full jet engine, keyboard sucking air through the deck





