Readings shared November 23, 2025

The readings shared in Bluesky on 23 November 2025 are: DeepMind’s latest: An AI for handling mathematical proofs. ~ Jacek Krywko. #AI #Math #LLMs #ITP #LeanProver #AlphaProof Verified certification

Vestigium
Reseña de «DeepMind’s latest - An AI for handling mathematical proofs»

En el artículo «DeepMind’s latest: An AI for handling mathematical proofs», se presenta a AlphaProof, un sistema de inteligencia artificial capaz de razonar y realizar demostraciones matemáticas compl

Vestigium
DeepMind’s latest: An AI for handling mathematical proofs

AlphaProof can handle math challenges but needs a bit of help right now.

Ars Technica

AlphaProof od DeepMind: AI zdobyła srebrny medal na Olimpiadzie Matematycznej. Ma to swoją cenę

Komputery są świetne w liczeniu, ale słabe w rozumowaniu. Teraz zespół Google DeepMind ogłosił przełom: AlphaProof, nowy system AI, dorównał srebrnym medalistom Międzynarodowej Olimpiady Matematycznej (IMO) 2024.

Twór DeepMind osiągnął wynik 28 punktów, stając się siódmym podmiotem (obok sześciu ludzi), który rozwiązał najtrudniejsze zadanie.

Jak zauważa ArsTechnica, to ogromny sukces. Do tej pory modele AI nie radziły sobie z dowodami matematycznymi, ponieważ polegały na statystycznym przewidywaniu, co „brzmi” poprawnie, a nie na zrozumieniu struktury matematyki.

TTRL: uczenie się jak człowiek

DeepMind wykorzystało architekturę znaną z AlphaZero (tej od gier: go, szachy), ale dodało trzeci, unikalny element: Test-Time Reinforcement Learning (TTRL). Ten komponent naśladuje podejście człowieka do trudnych problemów.

Kiedy AlphaProof nie potrafi rozwiązać zadania, tworzy setki jego wariacji – uproszczonych, uogólnionych lub luźno powiązanych. Następnie uczy się, próbując rozwiązać te łatwiejsze wersje, aby zdobyć praktykę i nabyć „praktyczne doświadczenie” w trakcie trwania zadania.

Cena srebrnego medalu: dni i setki TPU

Ten sukces ma jednak gigantyczną cenę, co jest kluczowym elementem krytycznej oceny. Po pierwsze, czas. Ludzie uczestniczący w Międzynarodowej Olimpiadzie Matematycznej mieli na rozwiązanie sześciu problemów dwie sesje po cztery i pół godziny. AlphaProof zmagał się z problemami przez… kilka dni, zużywając jednocześnie wiele jednostek TPU (Tensor Processing Unit).

W efekcie cały system potrzebował setek TPU-dni na problem. Jak przyznaje DeepMind, wymagania obliczeniowe są „najprawdopodobniej zbyt kosztowne dla większości grup badawczych”.

Jakby tego było mało AlphaProof nie działał całkowicie autonomicznie. Potrzebował ludzi do przetłumaczenia problemów na formalny język Lean oraz musiał wywołać drugą, wyspecjalizowaną AI (AlphaGeometry 2) do rozwiązania problemu z geometrią.

Podsumowując, AlphaProof to dowód na to, że AI osiągnęło poziom rozumienia logiki, ale do zastąpienia ludzkiego matematyka brakuje mu jeszcze… szybkości, elegancji i pieniędzy. Zatem, gdy ktoś powie, że AI jest dużo szybsza od człowieka, to niniejszy przypadek jest dowodem, że wciąż mamy przewagę.

AWS rzuca wyzwanie Copilotowi. Kiro już dostępne, a startupy dostaną je za darmo

#aiWMatematyce #alphaproof #deepmind #lean #miedzynarodowaOlimpiadaMatematyczna #nature #news #ttrl

Readings shared November 14, 2025

The readings shared in Bluesky on 14 November 2025 are: An introduction to formal real analysis (Lecture 18: Rearrangements). ~ Alex Kontorovich. #ITP #LeanProver #Math Choice trees: Representing and

Vestigium
How we achieved an IMO medal, one year before any other AI system. ~ Tom Zahavy. https://www.tomzahavy.com/post/how-we-achieved-an-imo-medal-one-year-before-everyone-else #AI #Math #ITP #LeanProver #AlphaProof
How we achieved an IMO medal, one year before any other AI system

It has been over a year since AlphaProof achieved silver-medal standard solving International Mathematical Olympiad (IMO) problems, by teaching itself mathematics in LEAN. This milestone was special to me because it was often hard to believe we would reach it. The IMO is a prestigious and recognised competition, where the top-6 young mathematicians from each country are trying to solve 6 problems in Algebra, Number Theory, Combinatorics, and Geometry. Achieving a medal in the IMO was proposed as

zahavy
Reseña de «Olympiad-level formal mathematical reasoning with reinforce

En el artículo «Olympiad-level formal mathematical reasoning with reinforcement learning» se presenta AlphaProof, un agente de IA que utiliza aprendizaje por refuerzo para resolver problemas matemátic

Vestigium

"Google DeepMind phát triển AlphaProof, một công cụ học tăng cường để tìm kiếm bằng chứng toán học chính thức. Công nghệ này có thể tự xác minh chính xác và cung cấp phần thưởng có thể xác minh. #ToánHọc #TríTuệNhânTạo #DeepMind #AlphaProof #HọcTăngCường #Mathematics #ArtificialIntelligence"

https://www.reddit.com/r/singularity/comments/1ovoulk/google_deepmind_olympiadlevel_formal_mathematical/

Readings shared October 03, 2025

The readings shared in Bluesky on 03 October 2025 are: Kevin Buzzard and Alex Kontorovich on the future of formal mathematics: A Mathlib initiative interview. ~ Oliver Nash. #ITP #LeanProver #Mathlib

Vestigium
Mathematics in the age of automated proofs: AlphaProof (From the lab into your hands). ~ Thomas Hubert. https://youtu.be/uhwfTOUIeiw #AI #Math #ITP #LeanProver #AlphaProof
Thomas Hubert: AlphaProof: From the lab into your hands

YouTube