Anemll (@anemll)
Gemma-4-26B-A4 MoE 모델을 iPhone에서 Swift MLX와 Flash SSD로 실행한 사례입니다. 아직 속도는 느리지만 최적화하면 초당 10토큰 이상이 가능할 것으로 예상해, 모바일 온디바이스 LLM 실행 가능성을 보여줍니다.
Anemll (@anemll)
Gemma-4-26B-A4 MoE 모델을 iPhone에서 Swift MLX와 Flash SSD로 실행한 사례입니다. 아직 속도는 느리지만 최적화하면 초당 10토큰 이상이 가능할 것으로 예상해, 모바일 온디바이스 LLM 실행 가능성을 보여줍니다.