AlphaProof od DeepMind: AI zdobyła srebrny medal na Olimpiadzie Matematycznej. Ma to swoją cenę
Komputery są świetne w liczeniu, ale słabe w rozumowaniu. Teraz zespół Google DeepMind ogłosił przełom: AlphaProof, nowy system AI, dorównał srebrnym medalistom Międzynarodowej Olimpiady Matematycznej (IMO) 2024.
Twór DeepMind osiągnął wynik 28 punktów, stając się siódmym podmiotem (obok sześciu ludzi), który rozwiązał najtrudniejsze zadanie.
Jak zauważa ArsTechnica, to ogromny sukces. Do tej pory modele AI nie radziły sobie z dowodami matematycznymi, ponieważ polegały na statystycznym przewidywaniu, co „brzmi” poprawnie, a nie na zrozumieniu struktury matematyki.
TTRL: uczenie się jak człowiek
DeepMind wykorzystało architekturę znaną z AlphaZero (tej od gier: go, szachy), ale dodało trzeci, unikalny element: Test-Time Reinforcement Learning (TTRL). Ten komponent naśladuje podejście człowieka do trudnych problemów.
Kiedy AlphaProof nie potrafi rozwiązać zadania, tworzy setki jego wariacji – uproszczonych, uogólnionych lub luźno powiązanych. Następnie uczy się, próbując rozwiązać te łatwiejsze wersje, aby zdobyć praktykę i nabyć „praktyczne doświadczenie” w trakcie trwania zadania.
Cena srebrnego medalu: dni i setki TPU
Ten sukces ma jednak gigantyczną cenę, co jest kluczowym elementem krytycznej oceny. Po pierwsze, czas. Ludzie uczestniczący w Międzynarodowej Olimpiadzie Matematycznej mieli na rozwiązanie sześciu problemów dwie sesje po cztery i pół godziny. AlphaProof zmagał się z problemami przez… kilka dni, zużywając jednocześnie wiele jednostek TPU (Tensor Processing Unit).
W efekcie cały system potrzebował setek TPU-dni na problem. Jak przyznaje DeepMind, wymagania obliczeniowe są „najprawdopodobniej zbyt kosztowne dla większości grup badawczych”.
Jakby tego było mało AlphaProof nie działał całkowicie autonomicznie. Potrzebował ludzi do przetłumaczenia problemów na formalny język Lean oraz musiał wywołać drugą, wyspecjalizowaną AI (AlphaGeometry 2) do rozwiązania problemu z geometrią.
Podsumowując, AlphaProof to dowód na to, że AI osiągnęło poziom rozumienia logiki, ale do zastąpienia ludzkiego matematyka brakuje mu jeszcze… szybkości, elegancji i pieniędzy. Zatem, gdy ktoś powie, że AI jest dużo szybsza od człowieka, to niniejszy przypadek jest dowodem, że wciąż mamy przewagę.
AWS rzuca wyzwanie Copilotowi. Kiro już dostępne, a startupy dostaną je za darmo
#aiWMatematyce #alphaproof #deepmind #lean #miedzynarodowaOlimpiadaMatematyczna #nature #news #ttrl
It has been over a year since AlphaProof achieved silver-medal standard solving International Mathematical Olympiad (IMO) problems, by teaching itself mathematics in LEAN. This milestone was special to me because it was often hard to believe we would reach it. The IMO is a prestigious and recognised competition, where the top-6 young mathematicians from each country are trying to solve 6 problems in Algebra, Number Theory, Combinatorics, and Geometry. Achieving a medal in the IMO was proposed as
"Google DeepMind phát triển AlphaProof, một công cụ học tăng cường để tìm kiếm bằng chứng toán học chính thức. Công nghệ này có thể tự xác minh chính xác và cung cấp phần thưởng có thể xác minh. #ToánHọc #TríTuệNhânTạo #DeepMind #AlphaProof #HọcTăngCường #Mathematics #ArtificialIntelligence"