Home Apple bestreitet Verwendung von YouTube-Inhalten zum Training von Apple Intelligence

Apple bestreitet Verwendung von YouTube-Inhalten zum Training von Apple Intelligence

Highlights

  • Apple hat bestritten, EleutherAIs Datensatz 'the Pile' für das Training von Apple Intelligence verwendet zu haben, hat ihn aber für OpenELM-Modelle genutzt.
  • 'The Pile' ist ein großer Korpus unethisch beschaffter Trainingsdaten, darunter auch YouTube-Titel, von EleutherAI.
  • Apples OpenELM, das im April veröffentlicht wurde, nutzte 'the Pile' und ist für die Forschung bestimmt, weitere Versionen sind nicht geplant.

Apple hat bestritten, einen unethisch gesammelten Datensatz von EleutherAI für das Training seines Flaggschiffs der künstlichen Intelligenz (KI), Apple Intelligence, verwendet zu haben. Das Unternehmen gab jedoch an, den Datensatz für ein anderes KI-Modell verwendet zu haben.

Nachdem diese Woche bekannt wurde, dass ein Unternehmen namens EleutherAI einen Datensatz mit Hunderttausenden von YouTube-Videotiteln verwendet hat, um einen Datensatz für das KI-Training zu erstellen, hat Apple gegenüber Apple Insider bestritten, dass EleutherAIs „Pile“ für das Training von Apple Intelligence verwendet wurde.

Das Unternehmen bestätigte jedoch, dass „the Pile“ für die Entwicklung der Open-Source-Modelle von OpenELM verwendet wurde, die Anfang des Jahres veröffentlicht wurden.

Was ist “the Pile” von EleutherAI?

EleutherAI ist eine gemeinnützige Organisation, die sich zum Ziel gesetzt hat, KI-Forschung und -Entwicklung für Unternehmen außerhalb der großen Technologieunternehmen, die hauptsächlich an großen KI-Modellen wie OpenAI arbeiten, zugänglicher zu machen.

Dies geschieht unter anderem durch die Bereitstellung von Trainingsdatensätzen für große Sprachmodelle und andere KI-Anwendungen. Anstatt jedoch Lizenzgebühren für den Zugang zu Daten zu zahlen oder Partnerschaften zur Nutzung von Daten aus Quellen einzugehen, durchsucht EleutherAI das Internet, um seine Daten zu erhalten. Dazu gehören die Untertitel von über 170.000 YouTube-Videos.

Das Ergebnis ist ‘The Pile’ – ein riesiger Korpus an unethisch beschafften Trainingsdaten, der die Einstiegshürde für kleinere Unternehmen in den KI-Markt senken soll. Aber auch größere Unternehmen haben von dem Datensatz profitiert.

Was ist Apples OpenELM?

Obwohl das Unternehmen den ‘Haufen’ nicht für das Training von Apple Intelligence verwendet hat (und behauptet, dass die Apple Intelligence-Modelle „auf lizenzierten Daten trainiert wurden, einschließlich Daten, die zur Verbesserung bestimmter Funktionen ausgewählt wurden, sowie auf öffentlich verfügbaren Daten, die von unserem Web-Crawler gesammelt wurden“), hat Apple zugegeben, dass es diese Daten für die Entwicklung seiner OpenELM-Modelle verwendet hat.

Apple veröffentlichte OpenELM im April. Es wurde für Forschungszwecke entwickelt und wird nicht für die Funktionen von Apple Intelligence verwendet. Apple erklärte gegenüber 9to5Mac, dass das Unternehmen keine Pläne habe, OpenELM zu erweitern oder weitere Versionen des Tools zu veröffentlichen.

Featured image credit: Apple

Redaktionelle Richtlinien von ReadWrite

Die ReadWrite Redaktionspolitik beinhaltet die genaue Beobachtung der Technologiebranche im Hinblick auf wichtige Entwicklungen, neue Produkteinführungen, Fortschritte bei der künstlichen Intelligenz, die Veröffentlichung von Videospielen und andere Ereignisse mit Nachrichtenwert. Die Redakteure weisen wichtige Entwicklungen fest angestellten Autoren oder freiberuflichen Mitarbeitern zu, die über Fachwissen in den jeweiligen Themenbereichen verfügen. Vor der Veröffentlichung werden die Artikel einer strengen Prüfung auf Genauigkeit und Klarheit unterzogen, um die Einhaltung der Stilrichtlinien von ReadWrite zu gewährleisten.

Ali Rees
Tech journalist

Ali Rees is a freelance writer based in the UK. They have worked as a data and analytics consultant, a software tester, and a digital marketing and SEO specialist. They have been a keen gamer and tech enthusiast since their childhood in are currently the Gaming and Tech editor at Brig Newspaper. They also have a Substack where they review short video games. During the pandemic, Ali turned their hand to live streaming and is a fan of Twitch. When not writing, Ali enjoys playing video and board games, live music, and reading. They have two cats and both of…

Die wichtigsten Tech-Schlagzeilen des Tages direkt in Ihren Posteingang

    Door u aan te melden, gaat u akkoord met onze voorwaarden en ons privacybeleid. U kunt zich op elk gewenst moment afmelden.

    Tech News

    Entdecken Sie das Neueste aus der Welt der Technik mit unseren Tech News. Wir bieten präzise, relevante Updates, die Sie über die sich dynamisch entwickelnde Tech-Landschaft informieren, mit ausgewählten Inhalten.

    Ausführliche Tech Stories

    Erfahren Sie mehr über die Bedeutung der Technik in ausführlichen Reportagen. Datenjournalismus bietet umfassende Analysen und enthüllt die Geschichten hinter den Daten. Verstehen Sie Branchentrends und gewinnen Sie einen tieferen Einblick in die komplizierten Beziehungen zwischen Technologie und Gesellschaft.

    Experten Berichte

    Expertenberichte, die Branchenkenntnisse und aufschlussreiche Analysen kombinieren, erleichtern die Auswahl. Erfahren Sie mehr über die technischen Feinheiten, holen Sie sich die besten Angebote und bleiben Sie mit unserem zuverlässigen Leitfaden für den sich ständig verändernden Technologiemarkt immer einen Schritt voraus.