GPUStack 0.2: Heterogeneous Distributed Inference – GPUStack.ai

GPUStack é uma plataforma de código aberto projetada para orquestrar clusters de GPU heterogêneos, facilitando a execução de Modelos de Linguagem Grande (LLMs) em hardware variado. A partir da versão 0.2, o GPUStack introduziu suporte aprimorado para inferência distribuída heterogênea, permitindo agrupar diferentes tipos de GPUs (mesmo de fabricantes distintos) e CPUs para rodar modelos de IA de forma otimizada

https://gpustack.ai/introducing-gpustack-0-2/

#CodigoAberto #ComputacaoHeterogenea #selfhosted

GPUStack 0.2: Heterogeneous Distributed Inference – GPUStack.ai