Anemll (@anemll)

Gemma-4-26B-A4 MoE 모델을 iPhone에서 Swift MLX와 Flash SSD로 실행한 사례입니다. 아직 속도는 느리지만 최적화하면 초당 10토큰 이상이 가능할 것으로 예상해, 모바일 온디바이스 LLM 실행 가능성을 보여줍니다.

https://x.com/anemll/status/2040126326708031969

#gemma #mlx #iphone #moe #ondeviceai

Anemll (@anemll) on X

Got Gemma-4-26B-A4 MoE running on iPhone w/Flash SSD in Swift MLX. Still pretty slow, I expect 10+ t/s once optimized properly for Swift.

X (formerly Twitter)