Gemini «olvida» mucho antes de lo que Google promete: el millón de tokens no aplica al chat

Usuarios de los planes pagos AI Pro y Ultra denuncian que el chatbot comienza a perder el hilo de la conversación después de apenas 25-30 mensajes, muy lejos del límite de un millón de tokens que Google publicita. La diferencia entre la ventana de contexto del modelo y la del chat nunca se comunica con claridad (Fuente AndroidAutorithy).

Google vende sus planes pagos de Gemini con una promesa concreta: una ventana de contexto de hasta un millón de tokens, equivalente a 1.500 páginas de texto o 30.000 líneas de código. El problema es que esa cifra no describe lo que le pasa al usuario en una conversación real.

Usuarios en X y Reddit denunciaron que, si bien los servidores de Gemini pueden efectivamente ingerir un archivo estático masivo en el primer prompt, la memoria conversacional activa —el contexto dinámico del chat— parece estar severamente limitada, cayendo a un tope aproximado de 16.000 tokens, equivalente a unos 25 o 30 mensajes promedio. El resultado es que el modelo sufre de «amnesia» dentro de la misma sesión de chat, olvidando por completo instrucciones anteriores, bloques de código o restricciones que el usuario había establecido al inicio de la conversación.

La distinción técnica que Google no comunica con suficiente claridad es la diferencia entre la ventana de contexto del modelo y la del chat. En palabras del usuario de X @Soso_fun_yt, mientras el backend puede procesar archivos de gran tamaño en forma estática, la memoria dinámica de la conversación está embotellada en un límite mucho menor, lo que provoca el olvido progresivo. Algunos usuarios señalaron que la plataforma AI Studio sí ofrece la ventana de contexto correcta, pero esa no es la herramienta que usa la mayoría de los suscriptores.

La analogía que propone el artículo lo dice todo: es como si tu proveedor de internet anunciara una línea de 1 Gbps en su sitio web, sin mencionar en ningún lugar destacado que la velocidad de subida es de apenas 50 Mbps. Google sí publica información técnica sobre tokens de entrada y salida en su documentación para desarrolladores, pero esa información no llega al usuario promedio que paga su suscripción esperando lo que se le prometió.

Android Authority consultó a Google sobre la discrepancia entre la ventana de contexto del modelo y la del chat, y sobre si planea ofrecer información más prominente al respecto. La compañía no respondió al momento de publicación. Mientras tanto, quienes usan Gemini para proyectos largos o conversaciones técnicas extendidas deberían saber que el millón de tokens es, por ahora, más un horizonte teórico que una realidad práctica de uso diario.

#AIStudio #AIUltra #chatbot #contextwindow #gemini #GeminiAI #GeminiPro #google #GoogleAI #IA #InteligenciaArtificial #PORTADA #Suscripciones #tokens #Transparencia

Los nuevos límites de Gemini fallaron y Google tuvo que dar marcha atrás

Apenas una semana después de presentar en el Google I/O 2026 su nuevo sistema de límites de uso basado en poder de cómputo, Google se vio obligado a aplicar parches de urgencia tras una avalancha de quejas: usuarios suscriptores pagos reportaban que un solo prompt de generación de video consumía toda su cuota antes de que el video siquiera terminara de generarse.

https://twitter.com/joshwoodward/status/2060171610922058142

Google tuvo una semana complicada con Gemini. En el Google I/O 2026, la compañía presentó un nuevo sistema de límites de uso basado en poder de cómputo, reemplazando el modelo anterior que contabilizaba cada prompt por igual. La idea sonaba razonable sobre el papel: medir cuánto procesamiento consume cada solicitud en lugar de contar interacciones individuales. Luego los usuarios lo pusieron a prueba, y el rechazo fue inmediato.

Los casos más extremos resultaron difíciles de ignorar. Un suscriptor del plan Google AI Pro publicó un video como prueba mostrando cómo un único intento de generación de avatar consumió toda su cuota de cinco horas antes de que el video terminara de generarse. No fue el único: las primeras reacciones al cambio fueron mayoritariamente negativas, con usuarios cuestionando incluso la forma en que Google comunicó el nuevo sistema, que comparaba el plan Pro contra el nivel gratuito en lugar de explicar qué ofrecía en relación a lo que el propio plan Pro ofrecía antes.

El nuevo esquema, que entró en vigor el 20 de mayo, funciona de la siguiente manera: los límites se renuevan cada cinco horas hasta alcanzar un tope semanal, y el cálculo de consumo toma en cuenta la complejidad del prompt, las funciones utilizadas y la extensión de la conversación. Las tareas que más cuota consumen incluyen generación de imágenes, videos y música, Deep Research, el modelo Pro y las funciones de pensamiento extendido como Deep Think.

La respuesta de Google llegó rápido. Josh Woodward, líder del equipo de Gemini, anunció públicamente que Google está aplicando un tope al máximo de cuota que un solo prompt puede consumir al usar Gemini 3.1 Pro, de modo que una solicitud pesada no pueda agotar el presupuesto completo de una sesión. Además, Google confirmó que en el futuro los usuarios de la app de Gemini podrán comprar créditos de IA de pago por uso para continuar trabajando una vez alcanzado el límite, sin tener que esperar el reinicio de la cuota.

El contexto de fondo es relevante: el cambio llega menos de un mes después de que GitHub reformulara su plan Copilot, también abandonando un modelo de solicitudes fijas para adoptar «AI Credits» basados en tokens realmente utilizados. La tendencia es clara: los planes de tarifa plana para IA generativa están llegando a su límite natural frente a la creciente demanda de funciones computacionalmente intensivas. La pregunta que queda es si los usuarios pagarán más o simplemente utilizarán menos.

#AIUltra #cómputo #DeepResearch #gemini #GeminiPro #google #GoogleAI #GoogleIO2026 #IA #InteligenciaArtificial #JoshWoodward #limitesdeuso #PORTADA #Suscripciones #tecnologia

US Top News and Analysis | Google debuts new AI models, personal AI agents in effort to keep pace with OpenAI and Anthropic

AI generated summary, Read the full article for complete information.

Google unveiled a suite of new AI tools at its I O conference, aiming to stay competitive with OpenAI and Anthropic while expanding services for its massive user base. The centerpiece, Gemini 3.5 Flash, is a lighter‑weight, faster model that delivers cutting‑edge performance at roughly one‑third to one‑half the cost of comparable frontier models, and will become the default for the Gemini app and AI‑enabled search worldwide. A heavier Gemini 3.5 Pro is being tested internally and will roll out next month. Google also introduced Gemini Spark, a general‑purpose AI agent for the Gemini app that can reason across connected apps and act on user direction, currently in beta for trusted testers and AI Ultra subscribers. Additionally, the company revealed Omni, a world‑model that simulates physical environments and can edit video or generate realistic imagery within Flash, the Gemini app, Google Flow, and YouTube Shorts. These launches emphasize speed, lower latency, improved safety, and deeper product integration as Google seeks to broaden AI‑driven user experiences.

Read more: https://www.cnbc.com/2026/05/19/google-ai-ultra-gemini-spark-omni.html

#Google #OpenAI #SundarPichai #GeminiFlash #GeminiPro

Dev Kod Depolarını Çözen 10 Gemini 1.5 Pro Promptu

Selamlar geliştirici dostlar ve teknoloji meraklıları, Bir başkasının (veya aylar önceki kendinizin) yazdığı devasa bir kod deposuna (repository) ilk kez gi...

1YZ - Türkiye Yapay Zeka Forum, ChatGPT, Gemini ve Prompt Rehberleri
AI đang trở thành công cụ hỗ trợ thiết thực trong công việc hàng ngày, đặc biệt với những ai làm nội dung hoặc cần xử lý thông tin nhanh. \n\nGemini Pro là một lựa chọn đáng tham khảo nếu bạn muốn bắt đầu. \nChi tiết: https://taikhoanaz.vn/tai-khoan-gemini-pro/
\n\n#AItools #GeminiPro #Productivity

How many users are using platforms and apps that are federated with the #ActivityPub protocol?

I asked that #GeminiPro using deep research. As always it creates a kind of very lengthy report with a lot of facts using 77 sources.

At the end it tells me that the answer is about 15 million.

Well, is that really accurate and correct?

#GenerativeAI

#Google's new #GeminiPro model has record benchmark scores again: Gemini 3.1 Pro promises a Google LLM capable of handling more complex forms of work. The model has achieved record scores on key benchmarks, further intensifying the #AIrace among #techgiants. https://techcrunch.com/2026/02/19/googles-new-gemini-pro-model-has-record-benchmark-scores-again/?eicker.news #tech #media #news
Google's new Gemini Pro model has record benchmark scores — again | TechCrunch

Gemini 3.1 Pro promises a Google LLM capable of handling more complex forms of work.

TechCrunch

🤖 Gemini 3.1 Pro: l'ultima frontiera dell'AI per la risoluzione di task complessi come mai prima! #IntelligenzaArtificiale #GeminiPro #socialmedia #artificialintelligence #technology

🔗 https://aibay.it/notizie/gemini-31-pro-il-modello-ai-per-task-complessi-2026-02-20

Gemini 3.1 Pro, il modello AI per task complessi

Google lancia Gemini 3.1 Pro a pochi giorni dall'aggiornamento di Deep Think, accelerando la competizione con OpenAI e Anthropic nel campo del ragionamento avanzato.

AiBay

New surveys reveal AI is lifting productivity across docs, coding, support and sales. From OpenAI tools to Google DeepMind’s Gemini Pro and niche models like DeepThink, firms report faster output and larger AI workforces. Even the International Math Olympiad sees AI‑assisted prep. Curious how these trends reshape work? Read the full analysis. #AIProductivity #OpenAI #GeminiPro #AIWorkforce

🔗 https://aidailypost.com/news/surveys-show-ai-boosts-productivity-docs-coding-support-sales