Ollama 0.19, MLX 탑재로 Mac에서 AI 추론 속도 2배 빨라졌다

Ollama 0.19가 Apple MLX 프레임워크를 탑재해 Mac에서 AI 추론 속도를 최대 2배 향상. NVFP4 지원과 캐시 개선도 포함한 주요 업데이트를 소개합니다.

https://aisparkup.com/posts/10740