Ivan Fioravanti ᯅ (@ivanfioravanti)

M3 Ultra와 M5 Max에서 llamacpp를 활용해 작업 중이며, Neural Accelerators는 프롬프트 처리에 도움이 되지만 텍스트 생성에서는 M3 Ultra가 더 낫다고 언급합니다. batch inference에서 -np 설정이 성능에 큰 영향을 주고 이상한 결과도 관찰했다고 공유합니다.

https://x.com/ivanfioravanti/status/2051399357572759972

#llamacpp #apple #m3ultra #m5max #inference

Ivan Fioravanti ᯅ (@ivanfioravanti) on X

Working more and more on llamacpp on my M3 Ultra and M5 Max. Neural Accelerators help on prompt processing, but on text generation M3 Ultra wins. Still fighting on the batch inference, -np has dramatic impact on it and I get very strange results.

X (formerly Twitter)

ecohash.eth (@ecohash_co)

애플 실리콘 M3 Ultra 512GB 두 대를 확보했고, 향후 M5 애플 실리콘에 대한 기대를 언급했다. 256GB 최대 구성 루머가 사실이라도, 4노드 @exolabs 클러스터에서 두 대면 충분한 성능을 낼 수 있을 것이라고 전망했다.

https://x.com/ecohash_co/status/2048474681171443888

#apple #m3ultra #m5 #server #aiinfra

ecohash.eth (@ecohash_co) on X

@arpeyton @LottoLabs I was able to get two m3 ultra 512s before they were gone. Very excited about potential for m5 Apple silicon. Even if rumors of 256GB max configs are true, a pair of those will go a long way on a 4-node @exolabs cluster

X (formerly Twitter)

Ivan Fioravanti ᯅ (@ivanfioravanti)

Qwen3.6-35B-A3B 8bit 모델을 M3 Ultra와 M5 Max에서 비교한 결과, M5 Max가 더 뛰어난 성능을 보였다고 언급합니다. 로컬 AI 하드웨어 선택과 추론 성능 비교에 참고가 되는 벤치마크 성격의 내용입니다.

https://x.com/ivanfioravanti/status/2045381802655654254

#qwen #benchmark #m3ultra #m5max #localai

Ivan Fioravanti ᯅ (@ivanfioravanti) on X

Let me add and M3 Ultra vs M5 Max Qwen3.6-35B-A3B 8bit. M5 Max crushes M3 Ultra! 👀

X (formerly Twitter)

AISatoshi (@AiXsatoshi)

Mac Studio M3 Ultra와 512GB 메모리 구성의 트레이드인 예상 결과를 공유한 트윗이다. 고사양 AI/개발용 워크스테이션 관점에서 관심을 끌 수 있는 하드웨어 정보다.

https://x.com/AiXsatoshi/status/2044039649879068840

#macstudio #m3ultra #apple #hardware #aidev

AI✖️Satoshi⏩️ (@AiXsatoshi) on X

Mac studio M3 ultra メモリ512GB 下取りの見積り出した結果! ↓

X (formerly Twitter)
Mac Pro 正式停產 Apple 確認不再推出新一代型號
Apple 正式停產 Mac Pro 並將其從官方網站全面下架,所有舊連結現時均跳轉至 Mac 產品總覽頁面,外媒更獲 Apple 直接確認未來不會再推出任何新款 Mac Pro 硬件,終結這個歷史逾 20 年的專業桌上電腦產品線。
#流動電腦 #Apple #M3 Ultra #M4 Max
https://unwire.hk/2026/03/28/apple-officially-discontinues-mac-pro-replaced-by-mac-studio/notebook/?utm_source=rss&utm_medium=rss&utm_campaign=apple-officially-discontinues-mac-pro-replaced-by-mac-studio

AISatoshi (@AiXsatoshi)

M5 Max와 M3 Ultra의 로컬 LLM 성능 비교 벤치마크. Gemma 34B 프롬프트 처리: M5 Max 4,468 T/s, M3 Ultra 2,959 T/s(약 1.5배). 생성 속도: 35B급 Dense 모델에서 M5 Max 88.5 T/s > M3 Ultra 69 T/s, 반면 120B급 MoE 모델에서는 M3 Ultra 82 T/s > M5 Max 65 T/s. 로컬 LLM 운용 시 칩/시스템별 성능 차이가 뚜렷합니다.

https://x.com/AiXsatoshi/status/2031276979908206717

#m5max #m3ultra #localllm #benchmark

AI✖️Satoshi⏩️ (@AiXsatoshi) on X

M5MAXつええ M5 Max vs M3 Ultra:ローカルLLM性能 ■プロンプト処理 (Gemma 34B) M5 Max: 4,468 T/s M3 Ultra: 2,959 T/s の1.5倍 ■生成速度 ・35BクラスのDenseモデル M5 Max 88.5 T/s > M3 Ultra 69 T/s ・120BクラスのMoEモデル M3 Ultra 82 T/s > M5 Max 65 T/s

X (formerly Twitter)
Apple's 512GB Mac Studio vanishes, a quiet acknowledgment of the RAM shortage https://arstechni.ca/863B #Applesilicon #ramshortage #MacStudio #m3ultra #Apple #apple #m4max #Tech
Apple's 512GB Mac Studio vanishes, a quiet acknowledgment of the RAM shortage

Announcements this week were mostly business as usual, but Apple isn't immune.

Ars Technica
Speicherknappheit beim M3 Ultra: Apple deckelt Mac Studio bei 256 GB statt 512 GB RAM

Apple bietet den Mac Studio mit M3 Ultra nicht länger mit maximal 512 GB RAM an. Das System ist jetzt bei 256 GB gedeckelt, die mehr kosten.

ComputerBase
L'option 512Go de RAM disparait du Mac Studio M3 Ultra : la crise de la RAM touche aussi Apple
https://mac4ever.com/195015
#Mac4Ever #M3Ultra #MacStudio

Ivan Fioravanti ᯅ (@ivanfioravanti)

exolabs의 최신 버전에서 벤치마크 테스트를 진행하며, /bench/chat/completions 엔드포인트가 호출 간 캐시를 비활성화하는 기능을 제공함을 발견했다고 보고. 캐시 비활성화로 일관된 성능 측정이 가능해 M3 Ultra 성능 테스트에 적합하다는 점을 강조.

https://x.com/ivanfioravanti/status/2028047012109734067

#exolabs #api #benchmark #cache #m3ultra

Ivan Fioravanti ᯅ (@ivanfioravanti) on X

Doing some benchmark testing on @exolabs latest version is great! I've found the /bench/chat/completions endpoint that disables cache between calls! Exactly what I need! Let's push these M3 Ultras!

X (formerly Twitter)