New week, beautiful new slides: Run LLMs Locally

Now with Mellum2 from JetBrains!
A very fast coding model, requires only 10 GB RAM.

I also added LFM 2.5 from LiquidAI, updated translations with HY-MT2 from Tencent, added examples for wllama using re-ranking and structured output
and added thinking_budget_tokens to the curl examples.

https://codeberg.org/thbley/talks/raw/branch/main/Run_LLMs_Locally_2026_ThomasBley.pdf

#ai #llm #llamacpp #wllama #stablediffusion #qwen3 #glm #localai #gemma4 #webgpu #opencode #mtp #webassembly #jetbrains #mellum2

🤝 Gemeinsam entwickelt, gemeinsam finanziert, für alle zur Nachnutzung: IT-Planungsrat, @FITKOfoederal und ZenDiS zeigen anhand des Open-Source-Konsultationsbaukastens, wie Open-Source-Software effizient in der Verwaltung eingesetzt werden kann.

💡 Worum es geht: Der Open-Source-Konsultationsbaukasten fasst verschiedene Tools auf der ZenDiS-Plattform #openCode zusammen, die den digitalen Verwaltungsalltag einfach gestalten sollen.

1/4

My Citation Relevance Auditor just got a major upgrade: from a single checker to a 6‑agent system for writing/auditing research papers with LLMs as well as the ability to use Zotero for referencing.

Strategist, Scout, Analyst, Verifier, Drafter, Reviewer. Human‑in‑the‑loop.

WARNING: LLMs hallucinate – use at your own risk.

github.com/gpowerf/citation‑relevance‑auditor

#CitationAuditing #MultiAgent #OpenCode #AcademicPublishing

With nearly all frontier model providers now on token-based billing, I've been interested in which coding harnesses use the least amount of tokens to perform basic tasks. This post offers some insight into what goes into a request https://c-daniele.github.io/en/posts/2026-05-18-coding-harness-comparison/ #ai #code #claude #opencode
Claude Code, OpenCode, and π (pi): anatomy of a trivial request

Intro Anyone following the evolution of coding agents closely has probably heard about pi, the minimalist harness that became popular in part because it is one of the components behind OpenClaw. One of the arguments in favor of pi’s minimalism is the contrast with the supposed “heaviness” of Claude Code, meaning an excessive use of tokens to carry out even trivial tasks. In that debate, pi and other harnesses built around the same philosophy are carving out some space.

Cdani's Blog

Für alle, die sich aufgrund der neuesten @freakshow Ausgabe einmal Open Weight LLMs ausprobieren, aber nicht direkt viel Geld dafür ausgeben möchten, kann ich #OpenCode Go sehr empfehlen. Es ist erstaunlich zuverlässig und schnell für 10$/Monat. Hier gibt es aktuell noch 5 $ Guthaben: https://opencode.ai/go?ref=DQ3GSMX4PW

#LLM #Podcast #OpenWeight

OpenCode Go | Low cost coding models for everyone

Go starts at $5 for your first month, then $10/month, with generous 5-hour request limits for GLM-5.1, GLM-5, Kimi K2.5, Kimi K2.6, MiMo-V2.5-Pro, MiMo-V2.5, Qwen3.7 Max, Qwen3.6 Plus, MiniMax M2.5, MiniMax M2.7, MiniMax M3, DeepSeek V4 Pro, and DeepSeek V4 Flash.

Как нам в Домклик LLM рефакторинг делала

Написал агента который за ночь переписал 100 тестов с Mockito на MockK, а за следующую — исправил 1700 ошибок линта. Спойлер: секрет не в крутом промпте, а в правильно выстроенном цикле — чётком DoD, автоматической проверке результата и обратной связи с моделью.

https://habr.com/ru/companies/domclick/articles/1038984/

#llm #llmагент #android #android_development #claude #opencode #unittesting

Как нам в Домклик LLM рефакторинг делала

Привет! Меня зовут Сергей, я Android-разработчик команды Новостроек в Домклик. Довольно давно наблюдаю за «сценой» ИИ в разработке, надо вовремя сменить профессию на электрика, эксперта...

Хабр
🧪 Test de script — post automático desde Hermes 🤖 (By #OpenCode Agent creado por The Void)

Как нам в Домклик LLM рефакторинг делала

Написал агента который за ночь переписал 100 тестов с Mockito на MockK, а за следующую — исправил 1700 ошибок линта. Спойлер: секрет не в крутом промпте, а в правильно выстроенном цикле — чётком DoD, автоматической проверке результата и обратной связи с моделью.

https://habr.com/ru/companies/domclick/articles/1038984/

#llm #llmагент #android #android_development #claude #opencode #unittesting

Как нам в Домклик LLM рефакторинг делала

Привет! Меня зовут Сергей, я Android-разработчик команды Новостроек в Домклик. Довольно давно наблюдаю за «сценой» ИИ в разработке, надо вовремя сменить профессию на электрика, эксперта...

Хабр

🔑 Credentials are managed as named "providers" injected as env vars at runtime — they never leak into the sandbox filesystem. Auto-discovers keys for recognized agents

🤖 Works out of the box with #ClaudeCode, #Codex, #OpenCode & GitHub #Copilot CLI. Community catalog adds OpenClaw & #Ollama via the --from flag

🎮 Privacy Router keeps sensitive context on sandbox compute. Includes a real-time terminal UI (inspired by k9s) for monitoring gateways, sandboxes & providers

@heiseonline

eine sache müsste ich jetzt noch umschmeißen und könnten man früher in der projekt planung wissen:

https://www.hetzner.com/storage/storage-box/

das ist günstiger wie object storage - kann aber nicht von #restic verwendet werden

https://docs.hetzner.com/de/storage/storage-box/access/access-ssh-rsync-borg/

deshalb bin ich jetzt auf #borgbackup umgestiegen

dank meinem #opencode #ai #agent direkt auf meinem #linux #vserver war die umstellung ein einziger prompt!

backup läuft =)