Rohan Paul (@rohanpaul_ai)

Google의 Gemma 4 E2B 모델을 Galaxy S25 Ultra에서 완전 오프라인으로, thinking mode를 켠 상태로 구동한 사례가 공유됐다. 약 5.1B 파라미터 구조와 2B 수준의 효율 성능이 언급되며, 모바일 온디바이스 추론의 가능성을 보여준다.

https://x.com/rohanpaul_ai/status/2040830938448609658

#google #gemma #ondeviceai #offlineai #llm

Rohan Paul (@rohanpaul_ai) on X

Someboyd is running Google's Gemma 4 E2B model on a Galaxy S25 Ultra with thinking mode on, fully offline. The speed is nuts. The model uses per-layer embeddings, resulting in about 5.1B total parameters but effective performance around 2B.

X (formerly Twitter)