Home Was ist Google Gemini? Funktionsweise erklärt

Was ist Google Gemini? Funktionsweise erklärt

Highlights

  • Die KI von Google Gemini, die als Nachfolger von Bard eingeführt wurde, unterstützt mehrere Google-Produkte, darunter auch Android.
  • Das multimodale Modell von Gemini integriert Text, Bilder, Audio und Video für ein besseres Kontextverständnis.
  • Eine kostenlose und eine Premium-Version von Gemini sind für mobile Geräte verfügbar und erweitern die Funktionen von Google Assistant und Google Messages.

Neben Unternehmen wie Claude und ChatGPT hat sich Google zu einem führenden Unternehmen in der Welt der künstlichen Intelligenz (KI) und der Chatbot-Technologie entwickelt. Nach der Umbenennung seiner früheren Version, die unter dem Namen Bard bekannt war, läutet das Unternehmen nun die „Gemini-Ära“ ein. In typischer Google-Manier hat das Unternehmen jedoch seine Familie multimodaler KI-Modelle auf viele seiner anderen Produkte angewandt.

Hier ist, was wir über Google Gemini wissen.

Was ist Google Gemini?

Google Gemini betrat im Februar dieses Jahres die KI-Bühne und sorgte schnell für Aufsehen. Aber erst die Veröffentlichung von Gemini Live auf der „Made by Google“-Veranstaltung im August erregte wirklich Aufmerksamkeit. ReadWrite berichtete, dass Gemini Live die Konversations-KI direkt auf Android-Mobiltelefone bringt und es den Nutzern ermöglicht, sich in Echtzeit über komplexe Themen zu unterhalten, indem sie ihre Stimme einsetzen, anstatt zu tippen – eine viel natürlichere und interaktivere Erfahrung.

Im Grunde ist Gemini Googles Large Language Model (LLM), das eine Reihe von KI-Tools antreibt, die denen ähneln, die man vielleicht schon gesehen hat, wie z.B. ChatGPT von OpenAI. So wie das GPT-4-Modell von OpenAI die Grundlage für ChatGPT-4 und ChatGPT Plus bildet, ist Gemini die Grundlage für G. Es kann Fragen beantworten, Texte zusammenfassen, Code schreiben, übersetzen und Bilder erstellen (auf mobilen Geräten, nicht in der kostenlosen Browserversion).

Google arbeitet auch an Entwickler können die Funktionen von Gemini sogar in ihre eigenen Anwendungen integrieren.

Gemini könnte letztendlich den Google Assistant ersetzen und möglicherweise einen verbesserten, KI-gestützten Assistenten bieten, der nahtlos mit dem Google-Ökosystem interagiert.

Wie schneidet Gemini im Vergleich zu ChatGPT ab?

Google hat einige interessante Einblicke in die Funktionsweise seines KI-Modells Gemini gegeben. Wie viele führende KI-Modelle verwendet Gemini eine Transformationsarchitektur und wendet sowohl Pre-Tuning- als auch Fein-Tuning-Techniken an. Das Besondere an Gemini ist jedoch, dass es auf mehreren Medientypen gleichzeitig trainiert wurde – Text, Bilder, Audio und Video – anstatt sich auf jeden einzelnen zu konzentrieren.

Dieser Ansatz soll Gemini ein differenzierteres Verständnis von Sprache und Kontext vermitteln. Stellen Sie sich einen Ausdruck wie „Smalltalk“ vor. Wenn eine KI lediglich darauf trainiert wird, Bilder von „klein“ und „sprechen“ zu assoziieren, könnte sie dies wörtlich nehmen und ein Bild von kleinen Menschen erzeugen, die sich unterhalten. Da das Training von Gemini jedoch Sprache und Bild gleichzeitig integriert, sollte es auch die spielerischen Untertöne von „Small Talk“ erfassen.

Dieses multimodale Training hilft Gemini, „alle Arten von Input von Grund auf zu verstehen und zu verarbeiten“. So kann er beispielsweise Diagramme mit Bildunterschriften lesen, Zeichen interpretieren und Informationen aus Texten, Bildern und mehr zusammenführen. Während diese Funktionen bei der Einführung von Gemini innovativ waren, verfügen andere Modelle wie Claude 3.5 und GPT-4o inzwischen über ähnliche multimodale Fähigkeiten.

Ein weiteres wichtiges Merkmal von Gemini ist das lange Kontextfenster. Mit Gemini 1.5 Pro können bis zu zwei Millionen Token in eine einzige Eingabeaufforderung eingefügt werden, wodurch umfangreiche Dokumente, Datenbanken und komplexe Verträge verarbeitet werden können. Dies ist besonders praktisch, wenn man mit großen Textressourcen arbeitet oder eine RAG-Pipeline (Retrieval-Augmented Generation) aufbaut – allerdings können sich die Kosten summieren, wenn man regelmäßig die volle Kapazität nutzt.

Was die Leistung betrifft, zeigen Benchmarks, dass Gemini 1.5 Pro etwas hinter den Spitzenmodellen wie GPT-4o und Claude 3.5 Sonnet liegt, aber mit Modellen wie Llama 3 70B vergleichbar ist. Die leichtere Version, Gemini 1.5 Flash, ist vergleichbar mit GPT-4o Mini und Claude 3 Haiku, was sie zu einer soliden Option unter den Modellen der Mittelklasse macht.

Ist Google Gemini kostenlos?

Es gibt jetzt eine kostenlose Gemini-App für Android, die auf Wunsch sogar den Google Assistant auf dem Handy ersetzen kann. iPhone-Benutzer finden Gemini in der Google-App und es ist für alle über jeden Webbrowser zugänglich.

Neben der kostenlosen Version bietet Google eine Premium-Option namens Gemini Advanced an. Dieses Abonnement, das Teil des Google One AI Premium-Plans ist, ermöglicht den Zugang zu einem leistungsstärkeren Modell, Gemini Ultra. Abonnenten profitieren von zusätzlichen Vorteilen wie der Nutzung von Gemini Live auf mobilen Geräten – einem sprachgesteuerten, freihändigen KI-Erlebnis für Android. Unabhängig davon, ob du die kostenlose oder die aktualisierte Version verwendest, gibt es zahlreiche Möglichkeiten, auf Gemini auf verschiedenen Geräten zuzugreifen.

Was ist Gemini Google Messages?

Google hat sich bei Gemini auf die Integration in Produktivitätsanwendungen wie Docs und Gmail konzentriert, aber jetzt hat es seinen Weg in Google Messages gefunden – eine Anwendung, die die meisten Android-Nutzer täglich verwenden. Ursprünglich auf der I/O 2024 angekündigt, macht es Gemini in Messages einfach, KI-Unterstützung für alles zu erhalten, vom Verfassen von Texten bis hin zur Planung des Wochenendes.

Bevor man mit Gemini in Messages chatten kann, muss man einige Voraussetzungen erfüllen: Man muss mindestens 18 Jahre alt sein, RCS-Chats aktiviert haben, ein eigenes Google-Konto nutzen, ein Android-Telefon mit mindestens 6 GB RAM besitzen und entweder auf Englisch (in unterstützten Ländern) oder Französisch (Kanada) eingestellt sein.

Sobald du bereit bist, kannst du wie folgt mit Gemini chatten:

  1. Öffne Google Messages
  2. Klicke unten rechts auf “Chat starten”
  3. Wähle oben Gemini als Kontakt aus
  4. Wähle eine Beispielfrage aus oder gib deine Frage ein
  5. Chatte, bis du den gewünschten Text oder das gewünschte Bild hast.

Gemini steht auch hinter Magic Compose, einer Funktion, die Google 2023 einführen wird, um dir beim Umschreiben und Optimieren von Nachrichtenstilen zu helfen. Mit Magic Compose kannst du deine Nachrichten auf verschiedene Arten anpassen, aber die Flexibilität ist geringer als bei einem vollständigen Chat mit Gemini.

Mit Gemini in Messages musst du nicht in die spezielle Gemini-Anwendung wechseln oder Gemini als Standard-Assistenten festlegen, aber es ist nicht ganz das volle Erlebnis. Antworten werden als Text formatiert, was zu einigen Problemen führen kann. Im Moment ist es ein praktisches Tool für schnelle Ideen und Antworten, auch wenn es nicht so vielseitig ist wie andere Gemini Apps.

Wie gut ist Google Gemini?

Google Gemini behauptet sich im Rennen um die KI, insbesondere durch seine starken multimodalen Fähigkeiten und die nahtlose Integration in die Google Apps. ChatGPT macht unterdessen Fortschritte mit seiner neuen SearchGPT-Funktion, die zum ersten Mal Datenzugriff in Echtzeit bietet.

Google hat jedoch einen großen Vorteil durch seinen umfangreichen Suchindex, der Hunderte von Milliarden Seiten umfasst – eine solide Grundlage für seine Zuverlässigkeit. Berichten zufolge arbeitet das Unternehmen auch an einem neuen KI-Tool mit dem Codenamen „Project Jarvis“, das einen Webbrowser zur Verwaltung alltäglicher Aufgaben betreiben soll.

Das Projekt könnte im Dezember zusammen mit Googles nächstem Vorzeigemodell Gemini vorgestellt werden, auf dem Jarvis laufen soll. Wenn es erfolgreich ist, könnte es die anderen Modelle in Bezug auf KI-Fähigkeiten übertreffen, aber wir müssen abwarten, wie es sich entwickelt.

Abbildung: Google / Canva

Redaktionelle Richtlinien von ReadWrite

Die ReadWrite Redaktionspolitik beinhaltet die genaue Beobachtung der Technologiebranche im Hinblick auf wichtige Entwicklungen, neue Produkteinführungen, Fortschritte bei der künstlichen Intelligenz, die Veröffentlichung von Videospielen und andere Ereignisse mit Nachrichtenwert. Die Redakteure weisen wichtige Entwicklungen fest angestellten Autoren oder freiberuflichen Mitarbeitern zu, die über Fachwissen in den jeweiligen Themenbereichen verfügen. Vor der Veröffentlichung werden die Artikel einer strengen Prüfung auf Genauigkeit und Klarheit unterzogen, um die Einhaltung der Stilrichtlinien von ReadWrite zu gewährleisten.

Suswati Basu
Tech journalist

Suswati Basu is a multilingual, award-winning editor and the founder of the intersectional literature channel, How To Be Books. She was shortlisted for the Guardian Mary Stott Prize and longlisted for the Guardian International Development Journalism Award. With 18 years of experience in the media industry, Suswati has held significant roles such as head of audience and deputy editor for NationalWorld news, digital editor for Channel 4 News and ITV News. She has also contributed to the Guardian and received training at the BBC As an audience, trends, and SEO specialist, she has participated in panel events alongside Google. Her…

Die wichtigsten Tech-Schlagzeilen des Tages direkt in Ihren Posteingang

    Door u aan te melden, gaat u akkoord met onze voorwaarden en ons privacybeleid. U kunt zich op elk gewenst moment afmelden.

    Tech News

    Entdecken Sie das Neueste aus der Welt der Technik mit unseren Tech News. Wir bieten präzise, relevante Updates, die Sie über die sich dynamisch entwickelnde Tech-Landschaft informieren, mit ausgewählten Inhalten.

    Ausführliche Tech Stories

    Erfahren Sie mehr über die Bedeutung der Technik in ausführlichen Reportagen. Datenjournalismus bietet umfassende Analysen und enthüllt die Geschichten hinter den Daten. Verstehen Sie Branchentrends und gewinnen Sie einen tieferen Einblick in die komplizierten Beziehungen zwischen Technologie und Gesellschaft.

    Experten Berichte

    Expertenberichte, die Branchenkenntnisse und aufschlussreiche Analysen kombinieren, erleichtern die Auswahl. Erfahren Sie mehr über die technischen Feinheiten, holen Sie sich die besten Angebote und bleiben Sie mit unserem zuverlässigen Leitfaden für den sich ständig verändernden Technologiemarkt immer einen Schritt voraus.