Während Meta sein bisher größtes und leistungsfähigstes Large Language Model, Llama 3.1 405B, ankündigt, betont Mark Zuckerberg, wie wichtig es ist, dass die Technologie nicht von einer Handvoll Unternehmen kontrolliert wird.
Der CEO entschied sich für einen transparenten Ansatz und schrieb am Dienstag (23. Juli) einen öffentlichen Brief, in dem er erklärte, warum das LLM Open Source ist und warum dies „gut für die Welt“ ist.
„Ich glaube, dass Open Source für eine positive Zukunft der KI notwendig ist“, schrieb der Milliardär.
Mark is an incredible CEO.
What particularly stood out to me from our conversation was how deeply he thinks about open source and how it'll benefit Meta (and the world) in the long term.
A few of my favorite moments/quotes:
On the future of AI agents:
"I think we're going to… https://t.co/rhuOVcapbW
— Rowan Cheung (@rowancheung) July 24, 2024
„Open Source wird dafür sorgen, dass mehr Menschen auf der ganzen Welt Zugang zu den Vorteilen und Möglichkeiten der KI haben, dass die Macht nicht in den Händen einiger weniger Unternehmen konzentriert ist und dass die Technologie in der Gesellschaft gleichmäßiger und sicherer eingesetzt werden kann.“
Das neue Llama 3.1 405B ist das erste Open-Source-KI-Modell des Unternehmens auf der Borderline-Ebene. Im Gegensatz zu früheren Versionen wurde mehr Wert auf den Aufbau eines breiteren Ökosystems gelegt.
Das Team hat mit einer Reihe von Unternehmen zusammengearbeitet, um das Ökosystem zu erweitern: „Amazon, Databricks und NVIDIA“ bieten umfassende Dienstleistungen an, um Entwickler bei der Feinabstimmung und Weiterentwicklung ihrer eigenen Modelle zu unterstützen.
Zuckerberg erklärt, wie es zu dieser Bewegung kam: „Wir wollten sicherstellen, dass wir immer Zugang zu den besten Technologien haben und nicht in einem geschlossenen Ökosystem eines Konkurrenten landen, der unsere Entwicklung einschränken könnte.
“Eine meiner prägendsten Erfahrungen war, dass wir bei der Entwicklung unserer Dienste von den Möglichkeiten abhängig waren, die uns Apple auf seinen Plattformen bot.
„Die Art und Weise, wie sie Entwickler besteuern, die willkürlichen Regeln, die sie anwenden, und all die Produktinnovationen, die sie blockieren, würden es Meta und vielen anderen Unternehmen ermöglichen, viel bessere Dienste für die Menschen zu entwickeln, wenn wir die besten Versionen unserer Produkte entwickeln könnten und unsere Konkurrenten nicht in der Lage wären, uns in unseren Möglichkeiten einzuschränken“.
Was ist das Modell Llama 3.1 405B von Mark Zuckerbergs Meta?
Meta kündigte Llama 3.1 am Dienstag (23. Juli) offiziell an und beschrieb es als „hochmoderne Fähigkeiten in den Bereichen Allgemeinwissen, Steuerbarkeit, Mathematik, Werkzeugnutzung und mehrsprachige Übersetzung“.
Das LLM wurde auf mehr als 15 Billionen Plättchen trainiert und das Modell wurde auf mehr als 16 Tausend H100-GPUs trainiert, was es zum ersten Llama-Modell macht, das in einem solchen Maßstab erstellt wurde.
Meta sagt, sie hätten mit der Community gesprochen und erkannt, dass es bei der Entwicklung von generativer KI um viel mehr geht als nur um Prompting-Modelle.
Sie glauben, dass Entwickler mit dem Ökosystem Folgendes tun können: „Echtzeit- und Batch-Interferenzen, überwachtes Feintuning, Evaluierung des Modells für eine bestimmte Anwendung, kontinuierliches Pre-Training, Prompter-basierte Generierung, Funktionsaufrufe und Generierung synthetischer Daten“.
Featured Image: Via Anthony Quintano on Flickr