Logan Kilpatrick (@OfficialLoganK)
Ironwood TPU๋ณด๋ค 2~3๋ฐฐ ์ฑ๋ฅ์ด ํฅ์๋ ์ TPU๊ฐ ์ธ๊ธ๋์๊ณ , Gemini์์์ ํ์ฉ๋ ๊ธฐ๋๋๋ค๋ ๋ด์ฉ์ ๋๋ค. AI ๋ชจ๋ธ ํ์ตยท์ถ๋ก ์ฉ ํ๋์จ์ด์ ํฐ ์ฑ๋ฅ ๊ฐ์ ์ ์์ฌํ๋ ์ค์ํ ์ ๋ฐ์ดํธ์ ๋๋ค.
#AI #Accelerator chips are specialized hardwareโincluding GPUs, TPUs, and NPUsโdesigned specifically to speed up artificial intelligence, machine learning, and deep learning neural network workloads.
Omar Sanseviero (@osanseviero)
Google DeepMind๊ฐ ๋ก๋ณดํฑ์ค ์ก์ ๋ฌ๋ ์ดํฐ ํ๋ก๊ทธ๋จ์ ์๋กญ๊ฒ ์์ํ์ผ๋ฉฐ, ์ค๋์ด ์ง์ ๋ง๊ฐ์ผ์ด๋ค. AI ๋ก๋ด ๋ถ์ผ ์คํํธ์ ์ด๋ ๊ฐ๋ฐํ์ ์ ์ฉํ ์ง์ ํ๋ก๊ทธ๋จ์ผ๋ก ๋ณด์ธ๋ค.
NVIDIA์ Groq 3 LPX๋ Vera Rubin ํ๋ซํผ์ฉ ๋-์ค์ผ์ผ ์ ์ง์ฐ ์ถ๋ก ๊ฐ์๊ธฐ์ ๋๋ค. 256๊ฐ LPU ๊ธฐ๋ฐ์ผ๋ก ๋์ฝ๋์ ์ง์ฐ ๋ฏผ๊ฐ ์ฐ์ฐ(FFN, MoE)์ ๊ฐ์ํด ์์ธก ๊ฐ๋ฅํ ์ด์ ์ง์ฐ ํ ํฐ ์์ฑ๊ณผ ๋์ ๋์์ฑ ์ฒ๋ฆฌ๋ฅผ ์ง์ํฉ๋๋ค. 500MB ์จ์นฉ SRAM, ๊ณ ๋์ญ C2C ํต์ , ์ปดํ์ผ ์ฃผ๋ ๊ฒฐ์ ๋ก ์ ์คํ์ผ๋ก ์งํฐ๋ฅผ ์ค์ฌ ์ค์๊ฐ ์์ด์ ํธยท๋ํํ AI์ ์ต์ ํ๋๋ฉฐ NVL72 GPU์ ํจ๊ป ๊ณ ์ฒ๋ฆฌ๋ AI ํฉํ ๋ฆฌ์ ์ค์๊ฐ ๊ฒฝ๋ก๋ฅผ ๋ณํ ์ ๊ณตํฉ๋๋ค.