Alex Cheema (@alexocheema)
RDMA 불필요 주장: prefill/Decode 분해(분산·디스어그리게이션)는 대기시간(latency)에 민감하지 않아 고가의 RDMA 대신 10GbE로 충분하다는 기술적 분석과 결과를 공유했다는 내용. 네트워크 아키텍처 선택과 비용·성능 트레이드오프에 대한 인프라 논의임.
Alex Cheema (@alexocheema)
RDMA 불필요 주장: prefill/Decode 분해(분산·디스어그리게이션)는 대기시간(latency)에 민감하지 않아 고가의 RDMA 대신 10GbE로 충분하다는 기술적 분석과 결과를 공유했다는 내용. 네트워크 아키텍처 선택과 비용·성능 트레이드오프에 대한 인프라 논의임.