Google DeepMind hat einen großen Schritt getan, um künstliche Intelligenz (KI) an die menschliche Fähigkeit, komplexe mathematische Probleme zu lösen, anzunähern.
Die Forscher haben zwei neue Systeme, AlphaProof und AlphaGeometry 2, miteinander gekoppelt und mit Aufgaben der Internationalen Mathematik-Olympiade konfrontiert. Der weltweite Mathematikwettbewerb für Oberstufenschüler findet seit 1959 statt und besteht jedes Jahr aus sechs extrem schwierigen Fragen. Die Themen umfassen Algebra und Geometrie. Die Sieger erhalten eine Goldmedaille und stehen damit auf einem Podest mit den besten und intelligentesten jungen Mathematikern der Welt.
Die Ergebnisse der KI-Systeme waren zwar beeindruckend, reichten aber nicht ganz an das Niveau der intelligentesten Menschen auf diesem Niveau heran – zumindest noch nicht. Das „Team“ von Google DeepMind erreichte 28 von 42 möglichen Punkten und lag damit einen Punkt unter der für eine Goldmedaille erforderlichen Punktzahl.
Im Gegensatz zur menschlichen Leistung waren die Antworten von DeepMinds AlphaProof und AlphaGeometry 2 verständlicherweise entweder perfekt oder erbärmlich. Die KI löste vier Fragen mit Präzision und erhielt dafür Bestnoten, bei den anderen beiden ging sie leer aus. Die Technologie war nicht einmal in der Lage, die Antwort zu finden.
Brücken bauen zwischen den Sphären
Ein weiterer wichtiger Punkt ist, dass das DeepMind-Experiment praktisch keine zeitliche Begrenzung hatte. Einige Fragen wurden innerhalb von Sekunden beantwortet, andere dauerten drei Tage rund um die Uhr. Im Gegensatz dazu haben die menschlichen Teilnehmer der Olympiade maximal neun Stunden Zeit, um den Test zu absolvieren.
Die beiden KI-Systeme, die die Forscher verglichen haben, sollen sehr unterschiedlich sein. AlphaProof, das drei der Fragen beantwortete, kombiniert ein großes Sprachmodell (wie es in Chatbots verwendet wird) mit einer speziellen „Reinforcement Learning“-Technik. AlphaGeometry kombiniert ein LLM mit einem fokussierten, mathematisch orientierten Ansatz.
Thomas Hubert, leitender Forscher bei AlphaProof, erklärt: “Wir versuchen, eine Brücke zwischen diesen beiden Bereichen zu schlagen, um die Garantien der formalen Mathematik und die Daten der informellen Mathematik zu nutzen.
Image credit: Via Ideogram