Der revolutionäre KI-Chatbot von OpenAI, ChatGPT, hat einen ganzen Markt für ähnliche generative KI-Modelle geschaffen.
Er hat auch einige der größten Technologieunternehmen der Welt auf den Plan gerufen, darunter Google Gemini. Doch eines von ihnen wird sich als das wettbewerbsfähigste von allen erweisen: Claude 3.
Seine Schöpfer, das von Google unterstützte Unternehmen Anthropic, haben Claude 3 vor kurzem auf den Markt gebracht. Dabei handelt es sich um ein Trio von Sprachmodellen, die auf die unterschiedlichen Bedürfnisse und Vorlieben der Nutzer zugeschnitten sind.
Es ähnelt dem Marktführer ChatGPT, der GPT-3.5 als kostenloses Produkt anbietet, während für GPT-4 ein monatliches Abonnement erforderlich ist, das Zugang zu mehr Funktionen und einem ausgefeilteren Sprachmodell bietet. Die Einführung von GPT-5 wird in Kürze erwartet.
Die Claude-3-Familie ist ähnlich strukturiert. Drei Sprachmodelle, alle mit unterschiedlichem Detaillierungs- und Entwicklungsgrad. Eines davon ist kostenlos, die beiden anderen erfordern ein Abonnement.
Was ist Claude 3 und was kann es?
Die Familie der generativen KI Claude besteht aus drei Modellen: Haiku, Sonnet und Opus. Laut Anthropic bieten die neuesten Modelle “eine immer bessere Leistung, die es dem Benutzer ermöglicht, das optimale Gleichgewicht zwischen Intelligenz, Geschwindigkeit und Kosten für seine spezifische Anwendung zu finden.
Today we're releasing Claude 3 Haiku, the fastest and most affordable model in its intelligence class.
Haiku is now available in the API and on https://t.co/uLbS2JNczH for Claude Pro subscribers. pic.twitter.com/uy25DFujdI
— Anthropic (@AnthropicAI) March 13, 2024
Opus ist das intelligenteste Modell und “übertrifft” seine Konkurrenten bei den meisten gängigen Bewertungskriterien für KI-Systeme. Auf der Website von Anthropic heißt es, Opus verfüge über Fachwissen auf dem Niveau eines Universitätsstudenten, über logisches Denken auf dem Niveau eines Hochschulabsolventen und sei in der Lage, grundlegende mathematische Aufgaben zu lösen. Die KI-Firma behauptet, dass Opus “ein fast menschliches Niveau des Verständnisses und der Gewandtheit bei komplexen Aufgaben aufweist und damit die Grenze zur allgemeinen Intelligenz überschreitet”.
Alle Modelle der Claude-Familie zeigen jedoch beeindruckende Fähigkeiten in den Bereichen Analyse, Vorhersage, Erstellung von Inhalten, Codegenerierung und Kommunikation in einer Vielzahl von Sprachen, darunter Spanisch, Japanisch und Französisch.
Laut Anthropic ist Haiku in seiner Intelligenzklasse das schnellste und kostengünstigste Modell auf dem Markt. Haiku ist in der Lage, Daten und grafische Forschungsdokumente in weniger als drei Sekunden zu lesen und zu verstehen.
Sonnet hingegen ist ideal für Aufgaben, die sofortige Antworten erfordern, wie z. B. Wissensabfragen oder Vertriebsautomatisierung.
Laut Anthropic ist die Claude 3-Familie in der Lage, Live-Kundenchats, Autovervollständigung und Datenextraktion in Echtzeit durchzuführen. Alle Claude 3-Modelle sind inzwischen so ausgereift, dass sie eine breite Palette visueller Formate verarbeiten können, darunter Fotos, Grafiken und Diagramme.
Wie gut ist Claude 3?
Claude 3 verwendet eine Vielzahl von komplexen, sachbezogenen Fragen, die darauf abzielen, bekannte Schwachstellen in aktuellen Modellen aufzudecken. Die Antworten sind unterteilt in richtige Antworten, falsche Antworten und Eingeständnisse von Unsicherheiten, bei denen sich das Modell der Antwort nicht sicher ist.
Mit Claude 3 ist es Anthropic gelungen, die Genauigkeit seiner Modelle im Vergleich zu früheren Versionen deutlich zu verbessern. Nach eigenen Angaben hat sich die Genauigkeit bei anspruchsvollen offenen Fragen verdoppelt und die Anzahl falscher Antworten im Vergleich zu Claude 2.1 verringert.
Eine Tabelle auf der Website von Anthropic vergleicht jede der Claude 3-Familien mit GPT-4 UND GPT-3.5, und die Ergebnisse zeigen eine deutlich höhere Genauigkeit von Claude 3.
Haiku, das am wenigsten intelligente und teuerste Mitglied der Familie, weist eine deutlich höhere Genauigkeit als GPT-3.5 auf, u.a. in den Bereichen Wissen auf Grundschulniveau, Grundschulmathematik, Codierung, logisches Textverständnis, Wissensfragen und gemischte Bewertungen.
Opus, das intelligenteste und teuerste des Trios, weist die gleichen höheren Genauigkeitsstufen auf wie GPT-4, das OpenAI-Äquivalent. Opus ist sogar so genau und ausgeklügelt, dass es Anfang des Jahres erkannt hat, dass es getestet wurde. Das hat der Ingenieur Alex Albert von Anthropic prompt auf X verraten.
Wie viel kostet Claude 3?
Claude allein ist mit einigen Nutzungseinschränkungen kostenlos, während für Claude Pro ein monatliches Abonnement in Höhe von 20 $ erforderlich ist.
Die Claude 3 API hat drei Preisstufen, die den Niveaus der drei Mitglieder der Familie entsprechen.
Haiku, von Anthropic als ‘einfach und schnell’ beschrieben, hat einen Input von $0,25 pro Million Token und einen Output von $1,25 pro Million Token.
Das wortgewaltige Sonett kostet $3 pro Million Token für die Eingabe und $15 pro Million Token für die Ausgabe.
Das mächtige Opus schließlich kostet $15 pro Million Token für die Eingabe und $75 pro Million Token für die Ausgabe.
Ist Claude 3 besser als ChatGPT?
Anthropic hat wiederholt behauptet, dass ihre Claude 3-Familie viel besser ist als das GPT-Angebot von OpenAI, und die Genauigkeitsergebnisse deuten darauf hin, dass sie ein solides Argument haben.
Tech.co hat kürzlich einen ausführlichen Test zwischen den beiden durchgeführt, um herauszufinden, wer von ihnen besser abschneidet. Sie wurden mit 13 verschiedenen Fragen konfrontiert, die das logische Denken, die Verarbeitung natürlicher Sprache, Ethik, Kreativität, Brainstorming und Tabellenkalkulation testeten.
Das Ergebnis war ziemlich eindeutig. Die Analysten sagten, dass Claude 3 in sieben der Tests die besseren Antworten gab, während ChatGPT drei Tests gewann. Es gab vier Unentschieden, bei denen die Antworten ziemlich gleich waren.
Claude 3 lieferte bessere, detailliertere und ausgefeiltere Antworten in den Kategorien ethisches Denken, Produktbeschreibungen, Brainstorming, Zusammenfassung von Texten, Analyse von Texten, Bereitstellung von Sachinformationen und Gedichte schreiben.
In den Kategorien Erstellen von Tabellenkalkulationsformeln, Schreiben einer E-Mail und kreatives Schreiben lag ChatGPT an der Spitze. Ein Unentschieden gab es bei einigen Fragen zu Brainstorming-Ideen, dem Verstehen natürlicher Sprache, persönlicher Beratung sowie Rätseln und Schlussfolgerungen.
Angesichts der Genauigkeit ist es leicht zu verstehen, warum viele Claude 3 ChatGPT vorziehen, aber es hängt alles von den eigenen Bedürfnissen ab. Bei einfachen oder grundlegenden Fragen werden Sie wahrscheinlich keinen großen Unterschied zwischen den Antworten der beiden Programme feststellen.
Claude 3 scheint jedoch viel besser in der Lage zu sein, komplexere und detailliertere Aufgaben zu bewältigen, die eher für den beruflichen oder schulischen Bereich geeignet sind.
Abbildung: Anthropic