Mikhaíl Ilín (@ilin_pt)

LLM 가중치를 실리콘에 직접 넣어 기존 범용 GPU 기반 추론보다 1000배 빠르다는 주장과 매우 빠른 데모를 소개하며, 'weights in silicon' 방식의 하드웨어 가속이 큰 성능 혁신을 가져올 수 있음을 강조합니다.

https://x.com/ilin_pt/status/2029931657369674101

#llm #inference #hardware #silicon #acceleration

Mikhaíl Ilín (@ilin_pt) on X

this is genius 😱 they put the LLM weights IN SILICON and it is 1000x faster than traditional general gpu inference the demo is mindblowing fast why nobody talks about that?

X (formerly Twitter)