Home Google DeepMind nähert KI der menschlichen Fähigkeit an, komplexe Mathematik zu lösen

Google DeepMind nähert KI der menschlichen Fähigkeit an, komplexe Mathematik zu lösen

Highlights

  • Die KI-Systeme von Google DeepMind, AlphaProof und AlphaGeometry 2, haben an der Internationalen Mathematik-Olympiade teilgenommen, aber mit 28/42 Punkten nicht Gold erreicht.
  • Die KI-Systeme haben die Aufgaben entweder perfekt gelöst oder sind komplett durchgefallen, was zeigt, wie schwierig es ist, sich mit menschlichen Spitzenmathematikern zu messen.
  • Im Gegensatz zu den Menschen hatten die KI-Systeme kein Zeitlimit und brauchten teilweise bis zu drei Tage, um die Aufgaben zu lösen, was die Unterschiede in der Herangehensweise und den Fähigkeiten deutlich macht.

Google DeepMind hat einen großen Schritt getan, um künstliche Intelligenz (KI) an die menschliche Fähigkeit, komplexe mathematische Probleme zu lösen, anzunähern.

Die Forscher haben zwei neue Systeme, AlphaProof und AlphaGeometry 2, miteinander gekoppelt und mit Aufgaben der Internationalen Mathematik-Olympiade konfrontiert. Der weltweite Mathematikwettbewerb für Oberstufenschüler findet seit 1959 statt und besteht jedes Jahr aus sechs extrem schwierigen Fragen. Die Themen umfassen Algebra und Geometrie. Die Sieger erhalten eine Goldmedaille und stehen damit auf einem Podest mit den besten und intelligentesten jungen Mathematikern der Welt.

Die Ergebnisse der KI-Systeme waren zwar beeindruckend, reichten aber nicht ganz an das Niveau der intelligentesten Menschen auf diesem Niveau heran – zumindest noch nicht. Das „Team“ von Google DeepMind erreichte 28 von 42 möglichen Punkten und lag damit einen Punkt unter der für eine Goldmedaille erforderlichen Punktzahl.

Im Gegensatz zur menschlichen Leistung waren die Antworten von DeepMinds AlphaProof und AlphaGeometry 2 verständlicherweise entweder perfekt oder erbärmlich. Die KI löste vier Fragen mit Präzision und erhielt dafür Bestnoten, bei den anderen beiden ging sie leer aus. Die Technologie war nicht einmal in der Lage, die Antwort zu finden.

Brücken bauen zwischen den Sphären

Ein weiterer wichtiger Punkt ist, dass das DeepMind-Experiment praktisch keine zeitliche Begrenzung hatte. Einige Fragen wurden innerhalb von Sekunden beantwortet, andere dauerten drei Tage rund um die Uhr. Im Gegensatz dazu haben die menschlichen Teilnehmer der Olympiade maximal neun Stunden Zeit, um den Test zu absolvieren.

Die beiden KI-Systeme, die die Forscher verglichen haben, sollen sehr unterschiedlich sein. AlphaProof, das drei der Fragen beantwortete, kombiniert ein großes Sprachmodell (wie es in Chatbots verwendet wird) mit einer speziellen „Reinforcement Learning“-Technik. AlphaGeometry kombiniert ein LLM mit einem fokussierten, mathematisch orientierten Ansatz.

Thomas Hubert, leitender Forscher bei AlphaProof, erklärt: “Wir versuchen, eine Brücke zwischen diesen beiden Bereichen zu schlagen, um die Garantien der formalen Mathematik und die Daten der informellen Mathematik zu nutzen.

Image credit: Via Ideogram

Redaktionelle Richtlinien von ReadWrite

Die ReadWrite Redaktionspolitik beinhaltet die genaue Beobachtung der Technologiebranche im Hinblick auf wichtige Entwicklungen, neue Produkteinführungen, Fortschritte bei der künstlichen Intelligenz, die Veröffentlichung von Videospielen und andere Ereignisse mit Nachrichtenwert. Die Redakteure weisen wichtige Entwicklungen fest angestellten Autoren oder freiberuflichen Mitarbeitern zu, die über Fachwissen in den jeweiligen Themenbereichen verfügen. Vor der Veröffentlichung werden die Artikel einer strengen Prüfung auf Genauigkeit und Klarheit unterzogen, um die Einhaltung der Stilrichtlinien von ReadWrite zu gewährleisten.

Graeme Hanna
Tech Journalist

Graeme Hanna is a full-time, freelance writer with significant experience in online news as well as content writing. Since January 2021, he has contributed as a football and news writer for several mainstream UK titles including The Glasgow Times, Rangers Review, Manchester Evening News, MyLondon, Give Me Sport, and the Belfast News Letter. Graeme has worked across several briefs including news and feature writing in addition to other significant work experience in professional services. Now a contributing news writer at ReadWrite.com, he is involved with pitching relevant content for publication as well as writing engaging tech news stories.

Die wichtigsten Tech-Schlagzeilen des Tages direkt in Ihren Posteingang

    Door u aan te melden, gaat u akkoord met onze voorwaarden en ons privacybeleid. U kunt zich op elk gewenst moment afmelden.

    Tech News

    Entdecken Sie das Neueste aus der Welt der Technik mit unseren Tech News. Wir bieten präzise, relevante Updates, die Sie über die sich dynamisch entwickelnde Tech-Landschaft informieren, mit ausgewählten Inhalten.

    Ausführliche Tech Stories

    Erfahren Sie mehr über die Bedeutung der Technik in ausführlichen Reportagen. Datenjournalismus bietet umfassende Analysen und enthüllt die Geschichten hinter den Daten. Verstehen Sie Branchentrends und gewinnen Sie einen tieferen Einblick in die komplizierten Beziehungen zwischen Technologie und Gesellschaft.

    Experten Berichte

    Expertenberichte, die Branchenkenntnisse und aufschlussreiche Analysen kombinieren, erleichtern die Auswahl. Erfahren Sie mehr über die technischen Feinheiten, holen Sie sich die besten Angebote und bleiben Sie mit unserem zuverlässigen Leitfaden für den sich ständig verändernden Technologiemarkt immer einen Schritt voraus.