Google odpala Gemini 3.1 Pro. Sztuczna inteligencja z potężnym skokiem logiki

Google nie zwalnia tempa w wyścigu zbrojeń na rynku sztucznej inteligencji. Gigant z Mountain View właśnie ogłosił premierę modelu Gemini 3.1 Pro.

Google nie zwalnia tempa w wyścigu zbrojeń na rynku sztucznej inteligencji. Gigant z Mountain View właśnie ogłosił premierę modelu Gemini 3.1 Pro. Zamiast czekać na tradycyjną, dużą aktualizację „półgeneracyjną” (jak znane z przeszłości wersje 1.5 czy 2.5), firma zdecydowała się na szybki, punktowy przeskok o „0.1”. Powód? Skupiono się na jednym, ale za to kluczowym aspekcie: wdrożeniu nowego silnika, który zwiększa zdolności analityczne i radzenie sobie ze złożonymi problemami.

Innymi słowy, o ile poprzednie wersje skupiały się na szybkości (jak Gemini 3 Flash) czy ogólnej wszechstronności, tak Gemini 3.1 Pro zostało zaprojektowane z myślą o zadaniach, w których „prosta odpowiedź to za mało”.

Rdzeń z Deep Think i podwojona moc rozumowania

Najważniejszą nowością w wersji 3.1 Pro jest zaimplementowanie ulepszonej „inteligencji bazowej”, która zadebiutowała niedawno w wyspecjalizowanym modelu Gemini 3 Deep Think.

W praktyce przekłada się to na drastyczny wzrost zdolności analitycznych. Google pochwaliło się, że nowy model osiągnął wynik 77,1% w rygorystycznym teście ARC-AGI-2. Oznacza to, że Gemini 3.1 Pro oferuje ponad dwukrotnie wyższą wydajność w logicznym rozumowaniu niż jego bezpośredni poprzednik (wersja 3 Pro). To idealne narzędzie do przejrzystego tłumaczenia bardzo skomplikowanych zagadnień wizualnych, syntetyzowania ogromnych zbiorów danych w jeden czytelny widok czy wspierania rozbudowanych projektów kreatywnych.

Gdzie można z niego skorzystać?

Google stawia na szeroką dystrybucję od pierwszego dnia. Model Gemini 3.1 Pro debiutuje dziś w:

  • Oficjalnej aplikacji Gemini (dla użytkowników).
  • Usłudze NotebookLM (dla subskrybentów planów Google AI Pro oraz Ultra).
  • Narzędziach dla deweloperów: poprzez Gemini API, Google AI Studio, Vertex AI, środowisko Antigravity, Gemini Enterprise, Gemini CLI oraz Android Studio.

Obecnie model znajduje się w fazie „preview” (wersji zapoznawczej). Google wykorzystuje ten etap do ostatecznej walidacji wydajności – szczególnie w kontekście ambitnych, wieloetapowych działań autonomicznych (tzw. agentic workflows) – zanim udostępni tę technologię jako domyślny standard dla wszystkich.

Gemini staje się kompozytorem. Google udostępnia model muzyczny Lyria 3 dla wszystkich

#aktualizacjaGemini2026 #ARCAGI2Gemini #Gemini31Pro #GeminiAIStudio #GeminiDeepThink #GoogleGeminiNowości #LLMRozumowanie #sztucznaInteligencjaGoogle

Vahab Mirrokni (@mirrokni)

DeepMind가 블로그 포스트와 두 편의 논문을 공개하며 'Gemini Deep Think'가 학제간(수학·과학) 오픈 연구 문제 해결에 활용되는 사례를 제시했습니다. 트윗은 IMO/ICPC 골드(문제 해결 배경)를 출발점으로 삼아 Gemini Deep Think의 연구 가속화 성과를 알립니다(구체 내용은 블로그·논문 참조).

https://x.com/mirrokni/status/2021634568009527715

#deepmind #geminideepthink #research #ai #scientificdiscovery

Vahab Mirrokni (@mirrokni) on X

From IMO/ICPC Gold to open scientific discovery. 🥇🔬 Today, we're releasing a blog post and two papers demonstrating how Gemini Deep Think is solving open research problems across disciplines: https://t.co/oOl42QOVBy 1/6

X (formerly Twitter)
Google DeepMind führt Aletheia ein. Basierend auf Gemini Deep Think löste der Agent autonom eine Generalisierung des Erdős-Problems. Anders als normale Sprachmodelle nutzt das System Feedback-Schleifen zur Validierung von Zwischenschritten. Im Benchmark FutureMath Basic erreicht es 46 Prozent und übertrifft reine Inferenz-Modelle bei weitem. #GoogleDeepMind #Aletheia #GeminiDeepThink
https://www.all-ai.de/news/news26top/deepmind-aletheia-agent
Autonome Forschung: DeepMind stellt Mathematik-Agent Aletheia vor

Das System agiert nicht mehr nur als Assistent, sondern führt eigene Beweisketten, Fehlerprüfungen und Korrekturen durch.

All-AI.de

CodeMender od Google DeepMind: AI, która sama znajduje i naprawia błędy bezpieczeństwa

Google DeepMind zaprezentowało wyniki badań nad CodeMender – nowym agentem AI zaprojektowanym do automatycznego poprawiania bezpieczeństwa kodu.

Rozwiązanie to ma odpowiadać na rosnący problem: choć tradycyjne metody i nowe narzędzia AI, takie jak Big Sleep czy OSS-Fuzz, są coraz skuteczniejsze w odkrywaniu luk, ich ręczne naprawianie jest czasochłonne. W miarę postępów w wykrywaniu podatności, programiści (ludzie) mogą przestać nadążać z ich usuwaniem.

Agent działa na dwa sposoby: reaktywnie, natychmiast łatając nowe luki, oraz proaktywnie, przepisując istniejący kod w celu wyeliminowania całych klas podatności. CodeMender wykorzystuje zdolności rozumowania modeli Gemini Deep Think, aby działać jako autonomiczny agent. Kluczowym elementem jest proces automatycznej walidacji, który gwarantuje, że proponowane poprawki są właściwe, nie powodują regresji (czyli nie psują innych funkcji w kodzie programu) i są zgodne z wytycznymi projektu, zanim zostaną przedstawione człowiekowi do weryfikacji.

Aby skutecznie znaleźć źródło problemu, CodeMender wykorzystuje zaawansowane techniki analizy programu, w tym analizę statyczną, dynamiczną i tzw. fuzzing (testowanie odporności kodu losowymi, celowo zniekształconymi danymi). Pozwala mu to zidentyfikować rzeczywistą przyczynę błędu, a nie tylko jego objawy – jak informuje Google DeepMind w swoim wpisie na oficjalnym blogu, w jednym z przykładów agent odkrył, że zgłaszany błąd przepełnienia bufora był w rzeczywistości spowodowany nieprawidłowym zarządzaniem stosu podczas parsowania XML. System korzysta również z wyspecjalizowanych agentów (systemy wieloagentowe), np. narzędzia opartego na LLM, które weryfikuje zmiany i pomaga w autokorekcie.

Google DeepMind poinformowało, że w ciągu ostatnich sześciu miesięcy, odkąd rozwijany jest CodeMender, zespół przesłał już 72 poprawki bezpieczeństwa do różnych projektów open source, z których wiele zostało już zaakceptowanych. Niektóre z tych projektów liczą nawet 4,5 miliona linii kodu. W ramach działań proaktywnych, CodeMender został użyty m.in. do biblioteki libwebp, aby dodać adnotacje -fbounds-safety. Mechanizm ten pomógłby zapobiec wykorzystaniu słynnej luki (CVE-2023-4863), która w przeszłości była używana do ataków na urządzenia z systemem iOS.

Badacze podkreślają, że choć wczesne wyniki są obiecujące, podchodzą do projektu ostrożnie, stawiając na niezawodność. Obecnie wszystkie poprawki generowane przez CodeMender są sprawdzane przez ekspertów DeepMind przed ich wysłaniem. Zespół planuje stopniowo zwiększać ten proces i kontaktować się z opiekunami krytycznych projektów open source, aby rozwijać własne dzieło na podstawie ich opinii. Celem jest udostępnienie CodeMender jako narzędzia, z którego będą mogli korzystać wszyscy programiści.

Vibe coding, czyli programowanie na czuja. AI miało zastąpić programistów, a stworzyło dla nich nowy rynek pracy

#AI #Bezpieczeństwo #CodeMender #cyberbezpieczeństwo #Gemini #GeminiDeepThink #Google #GoogleDeepMind #kod #lukiWOprogramowaniu #news #openSource #programowanie #sztucznaInteligencja