Gemini «olvida» mucho antes de lo que Google promete: el millón de tokens no aplica al chat

Usuarios de los planes pagos AI Pro y Ultra denuncian que el chatbot comienza a perder el hilo de la conversación después de apenas 25-30 mensajes, muy lejos del límite de un millón de tokens que Google publicita. La diferencia entre la ventana de contexto del modelo y la del chat nunca se comunica con claridad (Fuente AndroidAutorithy).

Google vende sus planes pagos de Gemini con una promesa concreta: una ventana de contexto de hasta un millón de tokens, equivalente a 1.500 páginas de texto o 30.000 líneas de código. El problema es que esa cifra no describe lo que le pasa al usuario en una conversación real.

Usuarios en X y Reddit denunciaron que, si bien los servidores de Gemini pueden efectivamente ingerir un archivo estático masivo en el primer prompt, la memoria conversacional activa —el contexto dinámico del chat— parece estar severamente limitada, cayendo a un tope aproximado de 16.000 tokens, equivalente a unos 25 o 30 mensajes promedio. El resultado es que el modelo sufre de «amnesia» dentro de la misma sesión de chat, olvidando por completo instrucciones anteriores, bloques de código o restricciones que el usuario había establecido al inicio de la conversación.

La distinción técnica que Google no comunica con suficiente claridad es la diferencia entre la ventana de contexto del modelo y la del chat. En palabras del usuario de X @Soso_fun_yt, mientras el backend puede procesar archivos de gran tamaño en forma estática, la memoria dinámica de la conversación está embotellada en un límite mucho menor, lo que provoca el olvido progresivo. Algunos usuarios señalaron que la plataforma AI Studio sí ofrece la ventana de contexto correcta, pero esa no es la herramienta que usa la mayoría de los suscriptores.

La analogía que propone el artículo lo dice todo: es como si tu proveedor de internet anunciara una línea de 1 Gbps en su sitio web, sin mencionar en ningún lugar destacado que la velocidad de subida es de apenas 50 Mbps. Google sí publica información técnica sobre tokens de entrada y salida en su documentación para desarrolladores, pero esa información no llega al usuario promedio que paga su suscripción esperando lo que se le prometió.

Android Authority consultó a Google sobre la discrepancia entre la ventana de contexto del modelo y la del chat, y sobre si planea ofrecer información más prominente al respecto. La compañía no respondió al momento de publicación. Mientras tanto, quienes usan Gemini para proyectos largos o conversaciones técnicas extendidas deberían saber que el millón de tokens es, por ahora, más un horizonte teórico que una realidad práctica de uso diario.

#AIStudio #AIUltra #chatbot #contextwindow #gemini #GeminiAI #GeminiPro #google #GoogleAI #IA #InteligenciaArtificial #PORTADA #Suscripciones #tokens #Transparencia

Los nuevos límites de Gemini fallaron y Google tuvo que dar marcha atrás

Apenas una semana después de presentar en el Google I/O 2026 su nuevo sistema de límites de uso basado en poder de cómputo, Google se vio obligado a aplicar parches de urgencia tras una avalancha de quejas: usuarios suscriptores pagos reportaban que un solo prompt de generación de video consumía toda su cuota antes de que el video siquiera terminara de generarse.

https://twitter.com/joshwoodward/status/2060171610922058142

Google tuvo una semana complicada con Gemini. En el Google I/O 2026, la compañía presentó un nuevo sistema de límites de uso basado en poder de cómputo, reemplazando el modelo anterior que contabilizaba cada prompt por igual. La idea sonaba razonable sobre el papel: medir cuánto procesamiento consume cada solicitud en lugar de contar interacciones individuales. Luego los usuarios lo pusieron a prueba, y el rechazo fue inmediato.

Los casos más extremos resultaron difíciles de ignorar. Un suscriptor del plan Google AI Pro publicó un video como prueba mostrando cómo un único intento de generación de avatar consumió toda su cuota de cinco horas antes de que el video terminara de generarse. No fue el único: las primeras reacciones al cambio fueron mayoritariamente negativas, con usuarios cuestionando incluso la forma en que Google comunicó el nuevo sistema, que comparaba el plan Pro contra el nivel gratuito en lugar de explicar qué ofrecía en relación a lo que el propio plan Pro ofrecía antes.

El nuevo esquema, que entró en vigor el 20 de mayo, funciona de la siguiente manera: los límites se renuevan cada cinco horas hasta alcanzar un tope semanal, y el cálculo de consumo toma en cuenta la complejidad del prompt, las funciones utilizadas y la extensión de la conversación. Las tareas que más cuota consumen incluyen generación de imágenes, videos y música, Deep Research, el modelo Pro y las funciones de pensamiento extendido como Deep Think.

La respuesta de Google llegó rápido. Josh Woodward, líder del equipo de Gemini, anunció públicamente que Google está aplicando un tope al máximo de cuota que un solo prompt puede consumir al usar Gemini 3.1 Pro, de modo que una solicitud pesada no pueda agotar el presupuesto completo de una sesión. Además, Google confirmó que en el futuro los usuarios de la app de Gemini podrán comprar créditos de IA de pago por uso para continuar trabajando una vez alcanzado el límite, sin tener que esperar el reinicio de la cuota.

El contexto de fondo es relevante: el cambio llega menos de un mes después de que GitHub reformulara su plan Copilot, también abandonando un modelo de solicitudes fijas para adoptar «AI Credits» basados en tokens realmente utilizados. La tendencia es clara: los planes de tarifa plana para IA generativa están llegando a su límite natural frente a la creciente demanda de funciones computacionalmente intensivas. La pregunta que queda es si los usuarios pagarán más o simplemente utilizarán menos.

#AIUltra #cómputo #DeepResearch #gemini #GeminiPro #google #GoogleAI #GoogleIO2026 #IA #InteligenciaArtificial #JoshWoodward #limitesdeuso #PORTADA #Suscripciones #tecnologia
Dev Kod Depolarını Çözen 10 Gemini 1.5 Pro Promptu

Selamlar geliştirici dostlar ve teknoloji meraklıları, Bir başkasının (veya aylar önceki kendinizin) yazdığı devasa bir kod deposuna (repository) ilk kez gi...

1YZ - Türkiye Yapay Zeka Forum, ChatGPT, Gemini ve Prompt Rehberleri
AI đang trở thành công cụ hỗ trợ thiết thực trong công việc hàng ngày, đặc biệt với những ai làm nội dung hoặc cần xử lý thông tin nhanh. \n\nGemini Pro là một lựa chọn đáng tham khảo nếu bạn muốn bắt đầu. \nChi tiết: https://taikhoanaz.vn/tai-khoan-gemini-pro/
\n\n#AItools #GeminiPro #Productivity

How many users are using platforms and apps that are federated with the #ActivityPub protocol?

I asked that #GeminiPro using deep research. As always it creates a kind of very lengthy report with a lot of facts using 77 sources.

At the end it tells me that the answer is about 15 million.

Well, is that really accurate and correct?

#GenerativeAI

#Google's new #GeminiPro model has record benchmark scores again: Gemini 3.1 Pro promises a Google LLM capable of handling more complex forms of work. The model has achieved record scores on key benchmarks, further intensifying the #AIrace among #techgiants. https://techcrunch.com/2026/02/19/googles-new-gemini-pro-model-has-record-benchmark-scores-again/?eicker.news #tech #media #news
Google's new Gemini Pro model has record benchmark scores — again | TechCrunch

Gemini 3.1 Pro promises a Google LLM capable of handling more complex forms of work.

TechCrunch

🤖 Gemini 3.1 Pro: l'ultima frontiera dell'AI per la risoluzione di task complessi come mai prima! #IntelligenzaArtificiale #GeminiPro #socialmedia #artificialintelligence #technology

🔗 https://aibay.it/notizie/gemini-31-pro-il-modello-ai-per-task-complessi-2026-02-20

Gemini 3.1 Pro, il modello AI per task complessi

Google lancia Gemini 3.1 Pro a pochi giorni dall'aggiornamento di Deep Think, accelerando la competizione con OpenAI e Anthropic nel campo del ragionamento avanzato.

AiBay

New surveys reveal AI is lifting productivity across docs, coding, support and sales. From OpenAI tools to Google DeepMind’s Gemini Pro and niche models like DeepThink, firms report faster output and larger AI workforces. Even the International Math Olympiad sees AI‑assisted prep. Curious how these trends reshape work? Read the full analysis. #AIProductivity #OpenAI #GeminiPro #AIWorkforce

🔗 https://aidailypost.com/news/surveys-show-ai-boosts-productivity-docs-coding-support-sales

Gemini 3 Pro tăng mức tin cậy lên 69% trong thử nghiệm mù (tăng từ 16% so với phiên bản trước), dẫn đầu 3/4 hạng mục: hiệu suất, tương tác và an toàn. Dù bị DeepSeek V3 vượt về phong cách giao tiếp, nó vẫn giành 5 lần lựa chọn ưu tiên của người dùng. Đánh giá HUMAINE nhấn mạnh tính nhất quán qua 22 nhóm nhân khẩu học, cảnh báo doanh nghiệp nên ưu tiên mô hình phù hợp nhu cầu và đối tượng cụ thể.

#AI #GeminiPro #ĐánhGiáAI #CôngNghệ #TrustworthyAI
#ThửNghiệmMù #ĐaDạngNgườiDùng #TriTueNhanTao

Interesting how Poetiq (company) can improve on the performance of the standard Gemini 3.0 Pro model by adding refinements and tricks. It leads to a 9% improvement on the ARC-AGI-2 Benchmark.
https://poetiq.ai/posts/arcagi_verified/
#AI #Poetiq #ArcAGI2 #Google #GeminiPro
Poetiq Shatters ARC-AGI-2 State of the Art at Half the Cost

We are proud to confirm that our system has officially outperformed existing methods, establishing a new state-of-the-art by a significant margin.