Logan Kilpatrick (@OfficialLoganK)
Ironwood TPU보다 2~3배 성능이 향상된 새 TPU가 언급되었고, Gemini에서의 활용도 기대된다는 내용입니다. AI 모델 학습·추론용 하드웨어의 큰 성능 개선을 시사하는 중요한 업데이트입니다.
#AI #Accelerator chips are specialized hardware—including GPUs, TPUs, and NPUs—designed specifically to speed up artificial intelligence, machine learning, and deep learning neural network workloads.
Omar Sanseviero (@osanseviero)
Google DeepMind가 로보틱스 액셀러레이터 프로그램을 새롭게 시작했으며, 오늘이 지원 마감일이다. AI 로봇 분야 스타트업이나 개발팀에 유용한 지원 프로그램으로 보인다.
NVIDIA의 Groq 3 LPX는 Vera Rubin 플랫폼용 랙-스케일 저지연 추론 가속기입니다. 256개 LPU 기반으로 디코드의 지연 민감 연산(FFN, MoE)을 가속해 예측 가능한 초저지연 토큰 생성과 높은 동시성 처리를 지원합니다. 500MB 온칩 SRAM, 고대역 C2C 통신, 컴파일 주도 결정론적 실행으로 지터를 줄여 실시간 에이전트·대화형 AI에 최적화되며 NVL72 GPU와 함께 고처리량 AI 팩토리와 실시간 경로를 병행 제공합니다.