Michael (@michaelharrigan)
Exo Labs 팀과 MLX 커뮤니티의 작업을 칭찬하며, 해당 솔루션이 RDMA를 통해 Thunderbolt 5(TB5)에서 문제없이 작동하는 것을 확인했다는 내용의 트윗입니다. RDMA와 TB5 조합으로 네트워크/IO 관련 작업이 원활히 동작함을 알리는 긍정적 기술 확인 메시지입니다.
Michael (@michaelharrigan)
Exo Labs 팀과 MLX 커뮤니티의 작업을 칭찬하며, 해당 솔루션이 RDMA를 통해 Thunderbolt 5(TB5)에서 문제없이 작동하는 것을 확인했다는 내용의 트윗입니다. RDMA와 TB5 조합으로 네트워크/IO 관련 작업이 원활히 동작함을 알리는 긍정적 기술 확인 메시지입니다.
Ivan Fioravanti ᯅ (@ivanfioravanti)
M5 Max는 prefill(전처리) 단계에서 훨씬 빠를 것으로 예상되며, RDMA over Thunderbolt와 두 대의 M3 Ultra를 결합하면 강력한 실험 환경을 구축할 수 있을 것이라고 전망합니다. 작성자는 1월 28일을 기대 일자로 언급하며 하드웨어 기반 성능 향상이 연구 실험에 미칠 영향을 강조합니다.
EXO Labs (@exolabs)
EXO가 GLM-4.7-Flash를 지원합니다. 4비트·5비트·6비트·8비트 양자화 모델이 MacBook, Mac Mini, Mac Studio에서 빠르게 동작하며, RDMA over Thunderbolt를 통한 맥 간 텐서 병렬 셰어링을 지원해 추가 가속이 가능합니다. 예시로 M4 Max MacBook Pro에서 초당 82 토큰 처리 속도를 기록했습니다.

EXO now supports GLM-4.7-Flash. 4-bit, 5-bit, 6-bit and 8-bit quants run fast on MacBook, Mac Mini and Mac Studio. Supports tensor parallel sharding across Macs with RDMA over Thunderbolt for even more speed. Here it is running at 82 tok/sec on M4 Max MacBook Pro.
Alex Cheema - e/acc (@alexocheema)
GLM-4.7-Flash를 4대의 M4 Pro Mac Mini에서 @exolabs를 통해 구동한 벤치마크 보고입니다. 텐서 병렬화에 RDMA over Thunderbolt와 MLX 백엔드를 사용해 초당 100토큰을 처리하며, 최적화를 통해 동일 구성에서 약 200토큰/초를 목표로 하고 있다고 합니다. Apple Silicon 기반 소형 클러스터에서의 LLM 성능 최적화 사례입니다.

Running GLM-4.7-Flash on 4 x M4 Pro Mac Minis using @exolabs. Uses tensor parallelism with RDMA over Thunderbolt & MLX backend (h/t @awnihannun). Runs at 100 tok/sec. We're working on optimizing this at @exolabs. Aiming to hit ~200 tok/sec on this setup soon.
Alex Cheema - e/acc (@alexocheema)
GLM-4.7-Flash를 4대의 M4 Pro Mac Mini에서 Exolabs를 통해 실행 중이라는 보고. Thunderbolt 기반 RDMA와 MLX 백엔드를 활용한 텐서 병렬화로 초당 약 100토큰 처리 성능을 기록하며, Exolabs에서 최적화를 진행해 동일 구성에서 약 200 tok/sec 달성을 목표로 하고 있음.

Running GLM-4.7-Flash on 4 x M4 Pro Mac Minis using @exolabs. Uses tensor parallelism with RDMA over Thunderbolt & MLX backend (h/t @awnihannun). Runs at 100 tok/sec. We're working on optimizing this at @exolabs. Aiming to hit ~200 tok/sec on this setup soon.
🚀 Một dự án mới: quản lý cụm Mac Studio dựa trên Swift cho RDMA, đang tìm chuyên gia Metal/MLX hoặc Swift 6 để hợp tác. Tính năng bao gồm RDMA, tích hợp trực tiếp HuggingFace, benchmarking và nhiều hơn nữa. Nếu quan tâm, reply hoặc PM nhé!
#RDMA #Swift #MacStudio #AI #HuggingFace #CôngNghệ #Metal #MLX
1,5 To de VRAM sur un Mac Studio - Le RDMA Thunderbolt 5 qui change la donne
https://fed.brid.gy/r/https://korben.info/mac-studio-rdma-thunderbolt-5-cluster-ia.html