Atlas: 103 tok/s en un LLM de 35B, ahora open source
¿Tu stack de inferencia LLM llega a 100 tokens/segundo? Atlas open source en Blackwell lo hace con Qwen3.6-35B. Benchmarks, comparativa con vLLM y cómo ...
https://blog.donweb.com/atlas-motor-inferencia-llm-open-source-qwen/
#atlasinference #qwen36 #inferencialocal #vllmalternativa #nvidiablackwell
