Zephyr's cancelled GPU shows the brutal math of the VRAM crisis
Zephyr's cancelled GPU shows the brutal math of the VRAM crisis
9 агентов, 6 моделей, 1 сервер: как собрать ИИ-компанию на open-source в марте 2026
Я собрал команду из 9 ИИ-агентов, которая проектирует, пишет, тестирует и деплоит других ИИ-агентов. Без людей в цикле. Стоимость — один сервер с GPU. Не бывает «лучшей модели» — бывает лучшая модель для конкретной роли. Оркестратору нужен reasoning (GPQA 88.4%), билдеру — кодогенерация (HumanEval 92.7%), критику — понимание tool use (tau-bench 87.4%). Поэтому вместо одного GPT-5 на все задачи — 6 open-source моделей на 9 ролей. Внутри: конкретный маппинг модель → роль с обоснованием через бенчмарки, трюк с шарингом инстансов (9 агентов = 3-4 модели), три конфигурации развёртывания от одной RTX 4090 (24 GB) до кластера A100 (211 GB), квантизация, инфраструктура инференса и интерактивный дашборд.
https://habr.com/ru/articles/1009608/
#LLM #opensource #мультиагентные_системы #MoE #Qwen #DeepSeek #GPU #VRAM #бенчмарки #agent_factory
96 ГБ видеопамяти в играх: нужно ли столько VRAM геймерам
Знаете, бывают новости, которые читаешь и немного теряешься — не потому что они сложные сами по себе, а потому что сложно поверить в их абсурдность. Именно такой стала публикация в корпоративном блоге Micron под названием «Новое узкое место производительности: как увеличение объема видеопамяти открывает возможности для гейминга и ИИ-ПК нового поколения». Это та самая Micron, которая в декабре прошлого года объявила о прекращении производства памяти под брендом Crucial . Тогда она честно сказала, что хочет сосредоточиться на поставках памяти для ИИ-серверов и «стратегически важных клиентов». Компания ушла с потребительского рынка — и тут же начала объяснять геймерам, почему им нужно больше памяти. Выглядит абсурдно, не так ли?
I've had at least 16GB of VRAM on my GPUs since 2017 (Vega64, specifically I had a frontier edition). And 64GB sysram also since 2017 when I built my first flagship Ryzen rig. That rig, btw, is the 3950X system on my second office desk, still humming along.
The fact that system OEMs are now regressing to 8GB of VRAM and even 8GB of sysram is insane. I had more than that in my Athlon64 rig in like 2005.
Even when the bubble finishes popping, I don't see the DIY PC market recovering in any sensible timeframe. Companies will be going out of business rapidly.
I guess slopware writers will have to improve in efficiency! #ram #dram #vram #gpu #ai #memory

Jay Sensei (@hckinz)
러시아 지하 포럼에서 Seedance 2.0 가중치 파일이 유출되었다는 주장이 제기되었습니다. 게시자는 해당 가중치를 96GB VRAM 환경에서 실행할 수 있다고 주장하며 사실 여부는 확인되지 않았습니다. 유출이 사실일 경우 모델 접근성·배포 방식과 커뮤니티 영향에 중요한 변화를 초래할 수 있습니다.

