Google hat sich die Spitzenposition in einer renommierten KI-Benchmark-Liste zurückerobert und OpenAI auf den zweiten Platz verwiesen.
Auf der angesehenen Chatbot Arena-Bestenliste hat das zu Alphabet gehörende Unternehmen mit der Einführung seines experimentellen Modells Gemini-Exp-1206 die Führung übernommen. Zuvor hatte Sam Altmans Unternehmen die Poleposition mit ChatGPT-40 inne, das knapp vor dem am 15. November veröffentlichten Gemini-Exp-114 lag.
Diese konkurrierenden Modelle großer Sprachmodelle (LLMs) lagen lange Zeit Kopf an Kopf, doch Google scheint nun den Rückstand auf seinen engsten Konkurrenten aufgeholt zu haben.
Chatbot Arena berichtete, dass die neue Google Gemini Version in wichtigen Kategorien wie Mathematik, kreativem Schreiben und visuellen Aufgaben erhebliche Verbesserungen zeigte – eine Steigerung um 40 Punkte im Vergleich zu früheren Modellen. Dennoch hat Tech Crunch darauf hingewiesen, dass die aktuellen KI-Benchmark-Ansätze die Bewertung von Modellen stark vereinfachen könnten.
What a way to celebrate one year of incredible Gemini progress — #1🥇across the board on overall ranking, as well as on hard prompts, coding, math, instruction following, and more, including with style control on.
Thanks to the hard work of everyone in the Gemini team and… https://t.co/BnjfUIexpU pic.twitter.com/i4Fof5KoWc
— Jeff Dean (@🏡) (@JeffDean) December 6, 2024
Google schlägt OpenAI mit einem kostenlosen Modell
Obwohl es noch Herausforderungen in der Bewertung von KI-Modellen gibt, muss sich Google derzeit keine Sorgen machen. Mit den beeindruckenden Fähigkeiten von Gemini-Exp-1206 ist es seinem Rivalen dicht auf den Fersen.
Das kostenlose Modell Exp-1206 kann Videoinhalte verarbeiten und verstehen, was wichtige Konkurrenten wie ChatGPT und Claude, die sich auf Bilder beschränken, nicht können. Das Modell verfügt über ein beeindruckendes Kontextfenster von 2 Millionen Tokens, wodurch es mehr als eine Stunde Videoinhalte analysieren kann.
Google hat OpenAI durch das Angebot des Gemini-Exp-1206 über die Google AI Studio-Plattform und die Gemini API kostenlos unterboten, während OpenAI die Preise für seine Premium-Dienste erhöht hat.
Dies könnte erheblich dazu beitragen, dass Nutzer bis zu 200 Dollar für ein Produkt sparen, das auf einem ähnlichen Leistungsniveau liegt. Diese kostenlose Verfügbarkeit könnte nicht nur den Markt aufhorchen lassen, sondern auch die Türen für eine breitere KI-Zugänglichkeit öffnen.
Bildnachweis: Midjourney