RT @mweinbach: Wer sagt, dass TPUs nicht schnell sein können! Das ist in etwa Groq-Geschwindigkeit, aber aus einer TPU 8i, und bisher mit dem Gemini Flash-Modell deutlich intelligenter. Video Max Weinbach (@mweinbach) Google hat gerade eine Demo gezeigt: Das Gemini Flash-Modell läuft mit 600 bis 1400 Tokens pro Sekunde auf einer TPU 8i. Der Spitzenwert lag bei rund 1480 tok/s, im Durchschnitt bei etwa 800 tok/s — https://nitter.net/mweinbach/status/2056785716819145126#m
mehr auf Arint.info
#AIInnovation #GeminiFlash #GoogleAI #MachineLearning #TechDemo #TPU #arint_info