Home Alibabas neues KI-Modell konkurriert mit OpenAI o1

Alibabas neues KI-Modell konkurriert mit OpenAI o1

Highlights

  • Alibaba bringt das KI-Modell QwQ-32B auf den Markt, das mit OpenAI konkurriert und durch seine Fähigkeiten im logischen Denken und bei der Faktenprüfung überzeugt.
  • Veröffentlicht unter der Apache-2.0-Lizenz ermöglicht QwQ-32B kommerzielle Nutzung, steht jedoch in China wegen Zensurbedenken in der Kritik.
  • Das Modell übertrifft OpenAIs o1-Modelle in Mathematik-Benchmarks, muss sich jedoch noch in der vollständigen Veröffentlichung und im Praxiseinsatz beweisen.

Der chinesische Einzelhandelsriese Alibaba hat einen Open-Source-Konkurrenten für das OpenAI o1-Modell für künstliche Intelligenz (KI) vorgestellt. Das Modell mit dem Namen QwQ ist laut Alibaba dem aktuellen Argumentationsmodell des Herstellers von ChatGPT ebenbürtig.

QwQ-32B wird unter der Apache 2.0 Lizenz veröffentlicht, was bedeutet, dass es kommerziell genutzt werden kann. Die KI ist noch nicht vollständig, da QwQ-32B noch nicht vollständig veröffentlicht wurde.

Alibaba ist nicht das erste große Technologieunternehmen, das eine Open-Source-KI veröffentlicht, denn Meta hat auch Llama 3.1 veröffentlicht, das ebenfalls auf einer ähnlichen Lizenzvereinbarung basiert. Das Angebot von Meta unterscheidet sich jedoch erheblich von dem, was Alibaba veröffentlicht hat.

Es handelt sich um ein Argumentationsmodell, das eine menschliche Problemlösung nachzubilden versucht. Es ermöglicht auch eine Selbstüberprüfung der Fakten. Die Modelle können auch komplexere und kompliziertere Probleme lösen als normale Large Language Models (LLMs) wie ChatGPT-4 und Claude 3.5.

In einem von Alibaba bereitgestellten Beispiel lieferte QwQ eine vollständige Aufschlüsselung, wie es zu seinem Ergebnis für zwei mathematische Fragen kam. Mit Hugging Faces Spaces kann man sehen, wie es die Parameter testet.

Alibabas neuestes KI-Modell weiß, wie viele Rs in Erdbeeren stecken

Screenshot of asking Alibaba AI QwQ who is Xi Jinping?

Ein Problem ist, wie bei anderen in China entwickelten KI-Modellen, dass die Beschränkungen des Landes sie in gewisser Weise einschränken. Selbst auf einfache Fragen wie „Wer ist Xi Jinping“ konnte das System keine Antwort geben.

Nachdem mehrere KI-Modelle in einem schwerwiegenden Fehler nicht herausfinden konnten, wie viele „r“ in „Erdbeere“ vorkommen, wurde dies schnell zu einem Lackmustest für neue Modelle. Bei Hugging Face stand es sogar ganz oben auf der Liste der gestellten Fragen.

QwQ answering how many Rs in strawberry in a very long way

Als wir QwQ-32B um eine Antwort baten, lieferten sie eine scheinbar lange Erklärung, wie sie das Problem gelöst hatten. Dieses Problem tritt bei einigen Modellen in der Art und Weise auf, wie sie die Daten aufschlüsseln, um ihre Antwort zu präsentieren. Wörter werden in Token zerlegt, die die Software dann verwenden kann, was manchmal zu Fehlern führt.

Im Vergleich zu den o1-Modellen von OpenAI berichtet das Qwen-Team von Alibaba, dass es in drei Benchmarks am besten mit o1-preview und Mini zurechtkommt. Es schlägt beide im MATH-500-Benchmark, bei dem die KIs mit wortreichen mathematischen Problemen konfrontiert werden.

Es bleibt abzuwarten, wie der Vergleich tatsächlich ausfällt, wenn Benchmarks und der Einsatz in der realen Welt an Bedeutung gewinnen.

Redaktionelle Richtlinien von ReadWrite

Die ReadWrite Redaktionspolitik beinhaltet die genaue Beobachtung der Technologiebranche im Hinblick auf wichtige Entwicklungen, neue Produkteinführungen, Fortschritte bei der künstlichen Intelligenz, die Veröffentlichung von Videospielen und andere Ereignisse mit Nachrichtenwert. Die Redakteure weisen wichtige Entwicklungen fest angestellten Autoren oder freiberuflichen Mitarbeitern zu, die über Fachwissen in den jeweiligen Themenbereichen verfügen. Vor der Veröffentlichung werden die Artikel einer strengen Prüfung auf Genauigkeit und Klarheit unterzogen, um die Einhaltung der Stilrichtlinien von ReadWrite zu gewährleisten.

Joel Loynds
Redakteur

Joel Loynds Besessenheit, schlechte Spiele und noch schlechtere Hardware aufzuspüren, damit du es nicht tun musst, hat ihn auf zu uns geführt. Seit er sechs Jahre alt ist, stöbert er in Spielen aller Art und Kuriositäten aus seiner ständig wachsenden Steam-Bibliothek. Seit 2008 schreibt er über Videospiele für Websites wie WePC und PC Guide sowie für Scan Computers. Zuletzt war Joel E-Commerce- und stellvertretender Tech-Redakteur bei Dexerto, wo er sich intensiv mit dem Handheld-Markt beschäftigte und über die wunderbare Welt der neuesten Technologien berichtete.

Die wichtigsten Tech-Schlagzeilen des Tages direkt in Ihren Posteingang

    Door u aan te melden, gaat u akkoord met onze voorwaarden en ons privacybeleid. U kunt zich op elk gewenst moment afmelden.

    Tech News

    Entdecken Sie das Neueste aus der Welt der Technik mit unseren Tech News. Wir bieten präzise, relevante Updates, die Sie über die sich dynamisch entwickelnde Tech-Landschaft informieren, mit ausgewählten Inhalten.

    Ausführliche Tech Stories

    Erfahren Sie mehr über die Bedeutung der Technik in ausführlichen Reportagen. Datenjournalismus bietet umfassende Analysen und enthüllt die Geschichten hinter den Daten. Verstehen Sie Branchentrends und gewinnen Sie einen tieferen Einblick in die komplizierten Beziehungen zwischen Technologie und Gesellschaft.

    Experten Berichte

    Expertenberichte, die Branchenkenntnisse und aufschlussreiche Analysen kombinieren, erleichtern die Auswahl. Erfahren Sie mehr über die technischen Feinheiten, holen Sie sich die besten Angebote und bleiben Sie mit unserem zuverlässigen Leitfaden für den sich ständig verändernden Technologiemarkt immer einen Schritt voraus.