Ivan Fioravanti ᯅ (@ivanfioravanti)
1조(1T) 파라미터급 모델(예: Kimi K2.5)을 로컬에서 실행하는 사례 보고: 작성자는 두 대의 Mac Studio M3 Ultra(512GB)에서 Apple MLX를 사용해 약 630GB RAM으로 모델을 구동해 초당 20토큰을 달성했고, @exolabs에서 실행했으며 @opencode를 활용해 자동 플레이 가능한 스네이크 게임을 생성하는 시연을 업로드했습니다. 로컬 LLM 실행과 실사용 데모를 보여주는 기술적 성과입니다.

Ivan Fioravanti ᯅ (@ivanfioravanti) on X
Can we run locally a 1T parameters like Kimi K2.5? 👀 Yes we can! Here it is: - running at 20 toks/s on @exolabs with Apple MLX on my two Mac Studio M3 Ultra 512GB using ~630GB RAM - @opencode used to create a snake game with autoplay - You can see model creating the game and


