Home Microsofts neues KI-Modell VASA-1 kann Fotos in “sprechende Gesichter” verwandeln

Microsofts neues KI-Modell VASA-1 kann Fotos in “sprechende Gesichter” verwandeln

Highlights

  • Microsoft hat VASA-1 vorgestellt, ein KI-Modell, das Standbilder in "sprechende Gesichter" verwandelt.
  • VASA-1 zeigt eine beeindruckende Fähigkeit zur Lippensynchronisation und realistische Kopfbewegungen.
  • Obwohl es für Animations- und KI-Filme vielversprechend ist, hat Microsoft aufgrund von Bedenken über möglichen Missbrauch keine unmittelbaren Pläne für eine kommerzielle Veröffentlichung.

Microsoft hat einen Blick auf VASA-1 geworfen, sein neues Modell der künstlichen Intelligenz (KI), das Standbilder mit großer Wirkung in “sprechende Gesichter” verwandeln kann.
Das Endprodukt kann beeindruckend oder erschreckend sein, aber die Lippensynchronisationsfähigkeit dieses Projekts ist sehr realistisch. Derzeit ist das Modell nur als Forschungsvorschau für Microsoft-Forscher verfügbar, aber die der Öffentlichkeit zugänglich gemachten Demos haben für Aufsehen gesorgt.

Es ist der jüngste Schritt von Microsoft im laufenden Kampf um die Vorherrschaft der generativen KI. Anfang dieser Woche kündigte das Unternehmen eine große KI-Investition in den Vereinigten Arabischen Emiraten an . Während Konkurrent Meta seinen KI-Assistenten für alle seine Plattformen freigegeben hat.

Die Prämisse ist, dass jeder ein Foto und eine Stimmprobe hochladen kann, um einen scheinbar lebenden, sprechenden Kopf des eigenen Gesichts zu erstellen. VASA-1 braucht nur ein einziges Foto und eine kurze Audiodatei, um ein ziemlich überzeugendes sprechendes Gesichtsvideo zu erstellen.

Das Besondere daran ist die Qualität der Lippensynchronität, der Kopfbewegungen und der erkennbaren Gesichtszüge.

Es wird echte Anwendungsmöglichkeiten für ein solches Programm geben, aber wie immer bei der KI sind Sicherheitsvorkehrungen erforderlich, da es zu Fehlinformationen und böswilligen Absichten kommen kann. Microsoft hat dies mit dem Eingeständnis quittiert, dass (VASA-1) wie andere verwandte Techniken zur Generierung von Inhalten immer noch potenziell dazu missbraucht werden könnte, sich als Mensch auszugeben.

In dem Forschungsbericht heißt es weiter: “Vor diesem Hintergrund haben wir keine Pläne, eine Online-Demo, eine API, ein Produkt, zusätzliche Implementierungsdetails oder damit zusammenhängende Angebote zu veröffentlichen, bis wir sicher sind, dass die Technologie verantwortungsvoll und in Übereinstimmung mit den entsprechenden Vorschriften eingesetzt wird.”

Wofür wird VASA-1 verwendet?

Die Lippensynchronität dieses Programms muss man gesehen haben, um es zu glauben, wie das Bild der rappenden Mona Lisa zeigt. Perfekt im Wortlaut? Ziemlich genau. Es wurde gesagt, dass die Forscher angenehm überrascht waren, wie gut das Programm funktioniert.

VASA-1 scheint sich hervorragend für Animationen zu eignen, von Spielen über Avatare für soziale Medien bis hin zu KI-Filmen, aber wie bereits erwähnt, gibt es derzeit keine Pläne für das Projekt, die über eine Forschungsdemonstration hinausgehen.

Das könnte sich ändern, da die Entwickler sehr daran interessiert sein werden, mit dem Modell zu arbeiten.

Image credit: Microsoft

Redaktionelle Richtlinien von ReadWrite

Die ReadWrite Redaktionspolitik beinhaltet die genaue Beobachtung der Technologiebranche im Hinblick auf wichtige Entwicklungen, neue Produkteinführungen, Fortschritte bei der künstlichen Intelligenz, die Veröffentlichung von Videospielen und andere Ereignisse mit Nachrichtenwert. Die Redakteure weisen wichtige Entwicklungen fest angestellten Autoren oder freiberuflichen Mitarbeitern zu, die über Fachwissen in den jeweiligen Themenbereichen verfügen. Vor der Veröffentlichung werden die Artikel einer strengen Prüfung auf Genauigkeit und Klarheit unterzogen, um die Einhaltung der Stilrichtlinien von ReadWrite zu gewährleisten.

Graeme Hanna
Tech Journalist

Graeme Hanna is a full-time, freelance writer with significant experience in online news as well as content writing. Since January 2021, he has contributed as a football and news writer for several mainstream UK titles including The Glasgow Times, Rangers Review, Manchester Evening News, MyLondon, Give Me Sport, and the Belfast News Letter. Graeme has worked across several briefs including news and feature writing in addition to other significant work experience in professional services. Now a contributing news writer at ReadWrite.com, he is involved with pitching relevant content for publication as well as writing engaging tech news stories.

Die wichtigsten Tech-Schlagzeilen des Tages direkt in Ihren Posteingang

    By signing up, you agree to our Terms and Privacy Policy. Unsubscribe anytime.

    Tech News

    Entdecken Sie das Neueste aus der Welt der Technik mit unseren Tech News. Wir bieten präzise, relevante Updates, die Sie über die sich dynamisch entwickelnde Tech-Landschaft informieren, mit ausgewählten Inhalten.

    Ausführliche Tech Stories

    Erfahren Sie mehr über die Bedeutung der Technik in ausführlichen Reportagen. Datenjournalismus bietet umfassende Analysen und enthüllt die Geschichten hinter den Daten. Verstehen Sie Branchentrends und gewinnen Sie einen tieferen Einblick in die komplizierten Beziehungen zwischen Technologie und Gesellschaft.

    Experten Berichte

    Expertenberichte, die Branchenkenntnisse und aufschlussreiche Analysen kombinieren, erleichtern die Auswahl. Erfahren Sie mehr über die technischen Feinheiten, holen Sie sich die besten Angebote und bleiben Sie mit unserem zuverlässigen Leitfaden für den sich ständig verändernden Technologiemarkt immer einen Schritt voraus.