Home Elon Musk’s xAI enthüllt Grok-1.5V, sein erstes multimodales Modell

Elon Musk’s xAI enthüllt Grok-1.5V, sein erstes multimodales Modell

Highlights

  • Elon Musk's xAI enthüllt Grok-1.5V, sein erstes multimodales Modell.
  • Grok-1.5V verfügt über erweiterte Argumentationsfähigkeiten und eine Kontextlänge von 128.000 Token.
  • Es soll in der Lage sein, Dokumente zu verstehen, Code zu übersetzen, Szenarien aus der realen Welt zu verarbeiten und einen umfangreichen Kontext zu verstehen.

Die xAI von Elon Musk hat offiziell ihr multimodales Modell der ersten Generation vorgestellt, das Dokumente verstehen, Code übersetzen und Szenarien aus der realen Welt verarbeiten kann.

Das Tool mit dem Namen Grok -1.5V soll über “starke Textfähigkeiten” verfügen und wird in Kürze für frühe Tester und bestehende Grok-Nutzer verfügbar sein.

Das Update kommt nur eine Woche nach dem Release von Grok-1, das im Oktober 2023 seine Testphase abgeschlossen hat.

“Grok-1.5 verfügt über verbesserte Argumentationsfähigkeiten und eine Kontextlänge von 128.000 Token”, so das Unternehmen in einem Blogbeitrag auf der xAI-Website.

Diese lange Kontextlänge ist ein neues Feature, das Grok in die Lage versetzt, eine bis zu 16-fache Kontextlänge zu verarbeiten. Sprich, es wird in der Lage sein, Informationen aus längeren Dokumenten und komplexeren Anfragen zu nutzen.

Das Modell wird auch weiterhin in der Lage sein, Text-Prompts zu befolgen, aber es kann nun auch Dokumente, wissenschaftliche Diagramme, Tabellen, Screenshots und Fotos verstehen. Es kann auch Diagramme in Python-Code übersetzen.

Grok-1.5V versteht die reale Welt

“Um nützliche KI-Assistenten für die reale Welt zu entwickeln, ist es entscheidend, das Verständnis eines Modells der physischen Welt zu verbessern. Um dieses Ziel zu erreichen, führen wir einen neuen Benchmark ein, RealWorldQA”, sagt das Team hinter Grok-1.5V.

Der Benchmark wird verwendet, um die Fähigkeiten multimodaler Modelle für das räumliche Verständnis der realen Welt zu bewerten. Als Beispiele nennt das Team die Frage, in welche Richtung ein Auto abbiegen kann und welches Objekt auf einem Foto am größten ist.

Die erste Version des Benchmarks enthält mehr als 700 Fotos, die alle eine Frage oder eine leicht überprüfbare Antwort enthalten.

Mit Blick auf die Zukunft beschreibt das Team die Notwendigkeit, die multimodalen Modelle zu verbessern: “Die Verbesserung des multimodalen Verständnisses und der Generierungsfähigkeiten sind wichtige Schritte beim Aufbau einer nützlichen AGI, die das Universum verstehen kann.”

“In den kommenden Monaten erwarten wir signifikante Verbesserungen beider Fähigkeiten für verschiedene Modalitäten wie Bilder, Audio und Video”.

Featured Image: Via Ideogram

Redaktionelle Richtlinien von ReadWrite

Die ReadWrite Redaktionspolitik beinhaltet die genaue Beobachtung der Technologiebranche im Hinblick auf wichtige Entwicklungen, neue Produkteinführungen, Fortschritte bei der künstlichen Intelligenz, die Veröffentlichung von Videospielen und andere Ereignisse mit Nachrichtenwert. Die Redakteure weisen wichtige Entwicklungen fest angestellten Autoren oder freiberuflichen Mitarbeitern zu, die über Fachwissen in den jeweiligen Themenbereichen verfügen. Vor der Veröffentlichung werden die Artikel einer strengen Prüfung auf Genauigkeit und Klarheit unterzogen, um die Einhaltung der Stilrichtlinien von ReadWrite zu gewährleisten.

Sophie Atkinson
Tech Journalist

Sophie Atkinson is a UK-based journalist and content writer, as well as a founder of a content agency which focuses on storytelling through social media marketing. She kicked off her career with a Print Futures Award which champions young talent working in print, paper and publishing. Heading straight into a regional newsroom, after graduating with a BA (Hons) degree in Journalism, Sophie started by working for Reach PLC. Now, with five years experience in journalism and many more in content marketing, Sophie works as a freelance writer and marketer. Her areas of specialty span a wide range, including technology, business,…

Die wichtigsten Tech-Schlagzeilen des Tages direkt in Ihren Posteingang

    By signing up, you agree to our Terms and Privacy Policy. Unsubscribe anytime.

    Tech News

    Entdecken Sie das Neueste aus der Welt der Technik mit unseren Tech News. Wir bieten präzise, relevante Updates, die Sie über die sich dynamisch entwickelnde Tech-Landschaft informieren, mit ausgewählten Inhalten.

    Ausführliche Tech Stories

    Erfahren Sie mehr über die Bedeutung der Technik in ausführlichen Reportagen. Datenjournalismus bietet umfassende Analysen und enthüllt die Geschichten hinter den Daten. Verstehen Sie Branchentrends und gewinnen Sie einen tieferen Einblick in die komplizierten Beziehungen zwischen Technologie und Gesellschaft.

    Experten Berichte

    Expertenberichte, die Branchenkenntnisse und aufschlussreiche Analysen kombinieren, erleichtern die Auswahl. Erfahren Sie mehr über die technischen Feinheiten, holen Sie sich die besten Angebote und bleiben Sie mit unserem zuverlässigen Leitfaden für den sich ständig verändernden Technologiemarkt immer einen Schritt voraus.