Mikhaíl Ilín (@ilin_pt)
LLM 가중치를 실리콘에 직접 넣어 기존 범용 GPU 기반 추론보다 1000배 빠르다는 주장과 매우 빠른 데모를 소개하며, 'weights in silicon' 방식의 하드웨어 가속이 큰 성능 혁신을 가져올 수 있음을 강조합니다.
Mikhaíl Ilín (@ilin_pt)
LLM 가중치를 실리콘에 직접 넣어 기존 범용 GPU 기반 추론보다 1000배 빠르다는 주장과 매우 빠른 데모를 소개하며, 'weights in silicon' 방식의 하드웨어 가속이 큰 성능 혁신을 가져올 수 있음을 강조합니다.