Mastodawn

Atlas: 103 tok/s en un LLM de 35B, ahora open source

¿Tu stack de inferencia LLM llega a 100 tokens/segundo? Atlas open source en Blackwell lo hace con Qwen3.6-35B. Benchmarks, comparativa con vLLM y cómo ...

https://blog.donweb.com/atlas-motor-inferencia-llm-open-source-qwen/

#atlasinference #qwen36 #inferencialocal #vllmalternativa #nvidiablackwell

Atlas: motor de inferencia LLM open source 103 tok/s

¿Tu stack de inferencia LLM llega a 100 tokens/segundo? Atlas open source en Blackwell lo hace con Qwen3.6-35B. Benchmarks, comparativa con vLLM y cómo ...

Blog Donweb