Der chinesische Einzelhandelsriese Alibaba hat einen Open-Source-Konkurrenten für das OpenAI o1-Modell für künstliche Intelligenz (KI) vorgestellt. Das Modell mit dem Namen QwQ ist laut Alibaba dem aktuellen Argumentationsmodell des Herstellers von ChatGPT ebenbürtig.
QwQ-32B wird unter der Apache 2.0 Lizenz veröffentlicht, was bedeutet, dass es kommerziell genutzt werden kann. Die KI ist noch nicht vollständig, da QwQ-32B noch nicht vollständig veröffentlicht wurde.
Alibaba ist nicht das erste große Technologieunternehmen, das eine Open-Source-KI veröffentlicht, denn Meta hat auch Llama 3.1 veröffentlicht, das ebenfalls auf einer ähnlichen Lizenzvereinbarung basiert. Das Angebot von Meta unterscheidet sich jedoch erheblich von dem, was Alibaba veröffentlicht hat.
Es handelt sich um ein Argumentationsmodell, das eine menschliche Problemlösung nachzubilden versucht. Es ermöglicht auch eine Selbstüberprüfung der Fakten. Die Modelle können auch komplexere und kompliziertere Probleme lösen als normale Large Language Models (LLMs) wie ChatGPT-4 und Claude 3.5.
In einem von Alibaba bereitgestellten Beispiel lieferte QwQ eine vollständige Aufschlüsselung, wie es zu seinem Ergebnis für zwei mathematische Fragen kam. Mit Hugging Faces Spaces kann man sehen, wie es die Parameter testet.
Alibabas neuestes KI-Modell weiß, wie viele Rs in Erdbeeren stecken
Ein Problem ist, wie bei anderen in China entwickelten KI-Modellen, dass die Beschränkungen des Landes sie in gewisser Weise einschränken. Selbst auf einfache Fragen wie „Wer ist Xi Jinping“ konnte das System keine Antwort geben.
Nachdem mehrere KI-Modelle in einem schwerwiegenden Fehler nicht herausfinden konnten, wie viele „r“ in „Erdbeere“ vorkommen, wurde dies schnell zu einem Lackmustest für neue Modelle. Bei Hugging Face stand es sogar ganz oben auf der Liste der gestellten Fragen.
Als wir QwQ-32B um eine Antwort baten, lieferten sie eine scheinbar lange Erklärung, wie sie das Problem gelöst hatten. Dieses Problem tritt bei einigen Modellen in der Art und Weise auf, wie sie die Daten aufschlüsseln, um ihre Antwort zu präsentieren. Wörter werden in Token zerlegt, die die Software dann verwenden kann, was manchmal zu Fehlern führt.
Im Vergleich zu den o1-Modellen von OpenAI berichtet das Qwen-Team von Alibaba, dass es in drei Benchmarks am besten mit o1-preview und Mini zurechtkommt. Es schlägt beide im MATH-500-Benchmark, bei dem die KIs mit wortreichen mathematischen Problemen konfrontiert werden.
Es bleibt abzuwarten, wie der Vergleich tatsächlich ausfällt, wenn Benchmarks und der Einsatz in der realen Welt an Bedeutung gewinnen.