Mastodawn

GLM-5.1: First Open-Source Model to Top SWE-bench Pro (2026)

Z.ai released GLM-5.1 on April 7, 2026 — a 754B open-weight model that became the first open-source AI to top SWE-bench Pro, beating GPT-5.4 and Claude Opus 4.6. MIT-licensed an...

https://wowhow.cloud/blogs/glm-5-1-zai-open-source-swe-bench-pro-developer-guide-2026

#wowhow #glm51 #zai #opensourceai

GLM-5.1: First Open-Source Model to Top SWE-bench Pro (2026)

GLM-5.1 is the first open-source model to top SWE-bench Pro with 58.4%, beating GPT-5.4. MIT-licensed, 754B params from Z.ai. Deploy via API, Ollama, or vLLM. Full guide.

Incognitosis [Unofficial]Apr 27

Programando una app para evitar pagar la «Conectividad Premium» de Tesla

https://fed.brid.gy/r/https://javipas.com/2026/04/27/programando-una-app-para-evitar-pagar-la-conectividad-premium-de-tesla/

Habr Apr 13

Как мы провели лоботомию 744-миллиардной нейросети GLM-5.1, чтобы запустить её на 16 ГБ VRAM

У нас не было фермы. У нас была бесплатная виртуальная машина на Kaggle с одной старушкой NVIDIA T4 на 16 ГБ VRAM. И у нас была концепция экстремального MLOps под кодовым названием «Russian Winter 26» . В этой статье я расскажу, как мы вскрыли архитектуру самого тяжелого китайского гиганта, переписали математику матриц внимания, обошли хардкодные ограничения GQA и заставили ядро модели сделать первый вдох на бесплатном железе.

https://habr.com/ru/articles/1022686/

#LLM #MLOps #Hugging_Face #PyTorch #GLM51 #Kaggle #нейросети #оптимизация #тензоры #искусственный_интеллект

Как мы провели лоботомию 744-миллиардной нейросети GLM-5.1, чтобы запустить её на 16 ГБ VRAM

Современный мир Open-Source AI несправедлив. Когда ZhipuAI выкатили свою новую архитектуру GLM-5.1, в её паспорте значилась цифра, от которой у владельцев домашних ПК темнеет в глазах — 744 миллиарда...

Хабр

Habr Apr 11

[Перевод] Локальный запуск GLM-5.1

Перевод подготовил автор канала Друг Опенсурса , приятного прочтения, заранее благодарю за подписку В этой статье мы подробно разберем процесс развертывания GLM-5.1 с использованием llama.cpp и форматов GGUF. Узнаем о системных требованиях, сборке и настройках, оптимизации и практическом применении.

https://habr.com/ru/articles/1022242/

#glm51 #llm #Llamacpp #Unsloth #GGUF #Локальный_запуск #tool_calling #Zai #искусственный_интеллект

Локальный запуск GLM-5.1

Перевод подготовил автор канала Друг Опенсурса , приятного прочтения, заранее благодарю за подписку GLM-5.1 — это новая открытая модель от Z.ai. Она имеет 744 млрд параметров (40 млрд активных)...

Хабр

Winbuzzer Apr 9

https://winbuzzer.com/2026/04/09/z-ai-releases-glm-5-1-754b-model-tops-swe-bench-pro-xcxwbn/

Z.ai Releases GLM-5.1: 754B Model Tops SWE-Bench Pro

#AI #Zai #GLM51 #GLM5 #AIModels #AgenticAI #OpenSourceAI #AICoding #VibeCoding #ChinaAI #AIBenchmarks #GenerativeAI

AI Sparkup Apr 9

GLM-5.1, 600번 반복 끝에 6배 성능을 끌어낸 AI 코딩 모델

Z.ai의 GLM-5.1은 600번 반복으로 6배 성능을 낸 AI 코딩 모델. 오래 실행할수록 나아지는 장기 수평선 능력과 MIT 오픈소스 공개 소식을 소개합니다.

https://aisparkup.com/posts/10992

Firethering Apr 8

ZhipuAI ran GLM-5.1 on a vector database optimization problem and let it go for 600 iterations. It did not run out of ideas. At iteration 50 it was sitting at roughly the same performance as the best single-session result any model had achieved. By iteration 600 it had reached 21,500 queries per second. The previous best was 3,547.

The model is MIT licensed & Available on HuggingFace .

Here's what this model can do & who is it for
https://firethering.com/glm-5-1-open-source-agentic-model/
#opensource #ai #glm51#trending #llm

GLM 5.1: The open source model that gets better the longer you run it - Firethering

Give an AI agent a hard problem and it usually figures out the easy wins fast. After that, more time does not help. It just sits there, trying the same things. ZhipuAI ran GLM-5.1 on a vector database optimization problem and let it go for 600 iterations. It did not run out of ideas. At iteration 50 it was sitting at roughly the same performance as the best single-session result any model had achieved. By iteration 600 it had reached 21,500 queries per second. The previous best was 3,547. That gap is not incremental improvement. It is a different category of result. GLM-5.1 is open source, MIT licensed, and the weights are on HuggingFace right now. It works with Claude Code, vLLM, and SGLang. If you are building anything that runs agents over long tasks, this one is worth understanding.

Firethering

香港01 Apr 8

內地媒體報道，通用大模型開發商智譜（2513）正式發布新一代開源模型GLM-5.1。據OpenRouter顯示，伴隨這次發布，智譜GLM再度提價10%。受到有關消息
https://www.hk01.com/財經快訊/60338182/ai概念股智譜推新模型兼加價-刺激股價曾飆近19-港股異動