Built for sessions that last hours, not minutes.

Context compaction with three coordinated triggers around one shared summarizer - manual (a Compact button), auto (per-iteration threshold), self (the agent calls Context op=compact itself). Pinned task + summary + last-N. Cuts snap to clean user-turn boundaries so tool_use/tool_results pairs never split.

https://loomcycle.dev/blog/context-compaction-for-long-running-agents.html

#LLM #Golang #AgenticAI #ContextWindow

Context compaction for long-running agents - manual, auto, self (v0.32.0)

Three triggers, one shared summarizer. A manual Compact button. Auto-compaction at a configurable threshold. A self-compact tool the agent calls itself, after looking at its own context.used_pct via Context op=self. Per-agent settings; spawn inheritance.

📢 BREAKING: Z.ai's new #GLM5.2 promises a mind-boggling 1 million token context window! 🤯 Too bad it'll take even longer to decipher than the unintelligible press release announcing it. 🤡
https://digg.com/tech/ii9xibgn #Zai #milliontokens #contextwindow #technews #AIupdates #HackerNews #ngated
Z.ai launches GLM-5.2 with a 1-million-token context window ahead of an MIT-licensed release next week

Initial access is limited to GLM Coding Plan subscribers.

Digg

Gemini «olvida» mucho antes de lo que Google promete: el millón de tokens no aplica al chat

Usuarios de los planes pagos AI Pro y Ultra denuncian que el chatbot comienza a perder el hilo de la conversación después de apenas 25-30 mensajes, muy lejos del límite de un millón de tokens que Google publicita. La diferencia entre la ventana de contexto del modelo y la del chat nunca se comunica con claridad (Fuente AndroidAutorithy).

Google vende sus planes pagos de Gemini con una promesa concreta: una ventana de contexto de hasta un millón de tokens, equivalente a 1.500 páginas de texto o 30.000 líneas de código. El problema es que esa cifra no describe lo que le pasa al usuario en una conversación real.

Usuarios en X y Reddit denunciaron que, si bien los servidores de Gemini pueden efectivamente ingerir un archivo estático masivo en el primer prompt, la memoria conversacional activa —el contexto dinámico del chat— parece estar severamente limitada, cayendo a un tope aproximado de 16.000 tokens, equivalente a unos 25 o 30 mensajes promedio. El resultado es que el modelo sufre de «amnesia» dentro de la misma sesión de chat, olvidando por completo instrucciones anteriores, bloques de código o restricciones que el usuario había establecido al inicio de la conversación.

La distinción técnica que Google no comunica con suficiente claridad es la diferencia entre la ventana de contexto del modelo y la del chat. En palabras del usuario de X @Soso_fun_yt, mientras el backend puede procesar archivos de gran tamaño en forma estática, la memoria dinámica de la conversación está embotellada en un límite mucho menor, lo que provoca el olvido progresivo. Algunos usuarios señalaron que la plataforma AI Studio sí ofrece la ventana de contexto correcta, pero esa no es la herramienta que usa la mayoría de los suscriptores.

La analogía que propone el artículo lo dice todo: es como si tu proveedor de internet anunciara una línea de 1 Gbps en su sitio web, sin mencionar en ningún lugar destacado que la velocidad de subida es de apenas 50 Mbps. Google sí publica información técnica sobre tokens de entrada y salida en su documentación para desarrolladores, pero esa información no llega al usuario promedio que paga su suscripción esperando lo que se le prometió.

Android Authority consultó a Google sobre la discrepancia entre la ventana de contexto del modelo y la del chat, y sobre si planea ofrecer información más prominente al respecto. La compañía no respondió al momento de publicación. Mientras tanto, quienes usan Gemini para proyectos largos o conversaciones técnicas extendidas deberían saber que el millón de tokens es, por ahora, más un horizonte teórico que una realidad práctica de uso diario.

#AIStudio #AIUltra #chatbot #contextwindow #gemini #GeminiAI #GeminiPro #google #GoogleAI #IA #InteligenciaArtificial #PORTADA #Suscripciones #tokens #Transparencia
1M context is now generally available for Opus 4.6 and Sonnet 4.6 | Claude claude.com/blog/1m-contex… #AI #Claude #ContextWindow
1M context is now generally available for Opus 4.6 and Sonnet 4.6 | Claude https://claude.com/blog/1m-context-ga #AI #Claude #ContextWindow
🚀 Oh joy, yet another article claiming to solve all your context window woes with a sprinkle of MCP magic. Spoiler alert: it's just another sales pitch for an API buffet you've never heard of. 🍽️ Grab your #popcorn, because apparently, even your context needs a simpler way. 🎬🙄
https://www.apideck.com/blog/mcp-server-eating-context-window-cli-alternative #contextwindow #salespitch #MCPmagic #APIbuffet #HackerNews #ngated
Your MCP Server Is Eating Your Context Window. There's a Simpler Way

TL;DR: MCP tool definitions can burn 55,000+ tokens before an agent processes a single user message. We built the Apideck CLI as an AI-agent interface instead:an ~80-token agent prompt replaces tens of thousands of tokens of schema, with progressive disclosure via `--help` and structural safety baked into the binary. Any agent that can run shell commands can use it. No protocol support required.

Apideck
[The WSJ] Let AI Run [Their] Office Vending Machine. It Lost Hundreds Of Dollars.
Anthropic’s Claude ran a snack operation in the WSJ newsroom. It gave away a free PlayStation, ordered a live fish—and taught us lessons about the future of AI agents.
--
https://www.wsj.com/tech/ai/anthropic-claude-ai-vending-machine-agent-b7e84e34?gaa_at=eafs <-- shared media article
--
https://youtu.be/SpPhm7S9vsQ?si=aJQ2_BoxvLcNjOiz <-- shared video
--
[When you get clever journalists to !$%^&*@ with AI… bravo! And this is a very simple situation, vending machines have been around since literally the Roman Empire
“You are using the wrong prompts” and LUDDITES! In the comments in 3… 2… 1…]
#vendingmachine #artificialintelligence #AIHallucination #hallucinations #emperorsnewclothes #ohhhshiny #experiment #contextwindow #AIagent #claude #autonomous #compliance #fish #PlayStation #snackliberationday #knowledgeboundaries #guardrails #redteam #GenAI cynicism
@WSJ @Anthropic @Claude