Google hat mit der Einführung von Gemini Live, einem mobilen KI-Tool mit erweiterten Sprachfunktionen, seine Konkurrenten offiziell geschlagen.
Das Tool fördert frei fließende Unterhaltungen, bei denen die Nutzer Fragen stellen, wichtige Diskussionen führen und über neue Ideen plaudern können. Das Google-Team beschreibt es als eine Art „Kumpel in der Hosentasche, mit dem man chatten kann“.
Gemini Live wird diese Woche (ab Dienstag, den 13. August) eingeführt, ist aber nur in englischer Sprache für Gemini Advanced-Abonnenten auf Android-Telefonen verfügbar. In den kommenden Wochen wird es auf iOS und andere Sprachen ausgeweitet.
Der Technologieriese hat es geschafft, das Tool vor OpenAI zu veröffentlichen, die ebenfalls an einem Sprachmodus arbeiten, der sich aber noch in der eingeschränkten Alpha-Phase befindet.
Die Sprachfunktionen mit Google sind auch im Freisprechmodus möglich, wie das Team schreibt: „Du kannst mit der Gemini-App im Hintergrund oder bei gesperrtem Telefon weiterreden, so dass du dein Gespräch unterwegs fortsetzen kannst, genau wie bei einem normalen Telefonat“.
Google Gemini Live wird in Apps und Erweiterungen integriert
Die KI wird in alle Google Apps integriert, so dass Nutzer alle Informationen an einem Ort abrufen können.
In den kommenden Wochen werden neue Erweiterungen eingeführt, darunter Keep, Tasks, Utilities und YouTube Music. Auch die Kalender-Erweiterung wird bald verfügbar sein. Als Beispiel nennt Google die Möglichkeit, ein Foto von einem Konzertflyer zu machen und Gemini zu fragen, ob man an diesem Tag Zeit hat. Wenn dein Kalender anzeigt, dass du an diesem Tag keine anderen Termine hast, kann dich Gemini daran erinnern, Karten zu kaufen.
Mit all den neuen Informationen, die verarbeitet werden müssen, hat das Team Maßnahmen ergriffen, um ungenaue Informationen zu vermeiden.
„Ironischerweise bedeutet die Verwendung großer Sprachmodelle, die natürliche Sprache besser interpretieren und komplexe Aufgaben bewältigen können, oft, dass einfache Aufgaben etwas länger dauern.
„Und obwohl generative KI flexibel genug ist, um eine Vielzahl von Aufgaben zu bewältigen, kann sie sich manchmal unerwartet verhalten oder ungenaue Informationen liefern.
“Um dem entgegenzuwirken, haben wir neue Modelle wie Gemini 1.5 Flash eingeführt, die schneller sind und bessere Antworten liefern.
Featured Image: Via Google’s Gemini Live press release