Alex Cheema (@alexocheema)

RDMA 불필요 주장: prefill/Decode 분해(분산·디스어그리게이션)는 대기시간(latency)에 민감하지 않아 고가의 RDMA 대신 10GbE로 충분하다는 기술적 분석과 결과를 공유했다는 내용. 네트워크 아키텍처 선택과 비용·성능 트레이드오프에 대한 인프라 논의임.

https://x.com/alexocheema/status/2027830902487707843

#rdma #10gbe #disaggregation #inference

Alex Cheema (@alexocheema) on X

@lmc_security @exolabs Not RDMA. Prefill/Decode disaggregation is not latency sensitive so RDMA is not necessary. It's 10GbE. We wrote up the analysis / results here: https://t.co/KGOfjRIJ9c

X (formerly Twitter)