Mercury 2, 확산 방식으로 기존 추론 모델보다 8배 빠른 LLM 등장
Inception Labs의 Mercury 2는 확산(diffusion) 방식으로 구현한 첫 상용 추론 모델. 엔드투엔드 레이턴시 1.7초로 기존 추론 모델 대비 최대 8배 빠른 속도를 제공합니다.Mercury 2, 확산 방식으로 기존 추론 모델보다 8배 빠른 LLM 등장
Inception Labs의 Mercury 2는 확산(diffusion) 방식으로 구현한 첫 상용 추론 모델. 엔드투엔드 레이턴시 1.7초로 기존 추론 모델 대비 최대 8배 빠른 속도를 제공합니다.Mercury 2 nutzt Diffusion für Reasoning.
Inception Labs setzt nicht auf Transformer, sondern verfeinert Textbausteine parallel. Das Resultat sind 1.009 Tokens pro Sekunde und 1,7 Sekunden Latenz auf Nvidia-Blackwell Hardware.
Das Modell bietet 128k Kontextfenster, JSON-Output und ist deutlich schneller als Claude oder Gemini.
#Mercury2 #InceptionLabs #KI
https://www.all-ai.de/news/news26top/inception-labs-geschwindigkeit-llm
Mercury 2: The fastest reasoning LLM, powered by diffusion
https://www.inceptionlabs.ai/blog/introducing-mercury-2
#HackerNews #Mercury2 #FastestLLM #DiffusionAI #AIResearch #TechInnovation