Wissenschaftler des in Kalifornien ansässigen Arc Institute haben das erste auf DNA trainierte biologische Basismodell namens „Evo“ veröffentlicht, das Vorhersagen treffen und Entwürfe erstellen kann.
Während andere Modelle auf Text trainiert werden, lernt Evo aus den Informationen, die in der DNA kodiert sind.
Dadurch entwickelt es interpretative und generative Fähigkeiten und kann nun DNA-Sequenzen von über einer Million Basen erzeugen.
Das neue Werkzeug hat bereits genau vorhergesagt, wie sich DNA-Änderungen auf Bakterien auswirken würden – ein großer Durchbruch für die zukünftige Forschung.
Evo wurde bereits Anfang des Jahres in einer Vorabveröffentlichung vorgestellt, doch nun zeigen die Forscher in Science, wie es zu einem tieferen Verständnis biologischer Sequenzen beitragen kann.
Das Modell wurde in den Labors von Brian Hie, Arc Innovation Investigator und Stanford Assistant Professor of Chemical Engineering, und Patrick Hsu, Arc Core Investigator und UC Berkeley Assistant Professor of Bioengineering, entwickelt. Zwanzig Wissenschaftler aus verschiedenen biologischen und computerwissenschaftlichen Disziplinen waren daran beteiligt.
„Evo entschlüsselt die Muster, die in Milliarden von Jahren der Evolution in die DNA geschrieben wurden, und eröffnet neue Wege, die Biologie zu verstehen und zu gestalten“, so Hsu. “Genauso wie die generative KI unsere Arbeit mit Text, Audio und Video revolutioniert hat, können die gleichen kreativen Fähigkeiten nun auf die grundlegenden Codes des Lebens angewendet werden“.
„Das Spannende an Evo ist, dass es ein echtes Grundlagenmodell für die Biologie ist“, fügt Hie hinzu. “Da es sowohl multimodal als auch multiskalig ist, bietet es uns einen einheitlichen Ansatz, um die immense Komplexität lebender Systeme zu nutzen.“
Das Arc Institute hat ein grundlegendes Modell für die DNA- und biologische Forschung entwickelt
Obwohl das Modell eine große Anzahl von DNA-Sequenzen erzeugen kann, will das Team diese Zahl noch erhöhen, da es Evo auf komplexere Organismen anwenden möchte.
Das Team beschreibt Evo als einen Anfang. „Unser nächstes Ziel ist es, über die Einzeller hinauszugehen und die vielzelligen Organismen zu verstehen, die die Evolution über Milliarden von Jahren hervorgebracht hat. Langfristig arbeiten wir auf ein neues Gebiet des ‚Genomdesigns‘ hin, bei dem wir ganze zelluläre Signalwege und möglicherweise ganze Organismen erzeugen können“, sagt Hsu.
„Während wir Evo auf komplexere Datensätze und größere Maßstäbe ausdehnen, arbeiten wir daran, diese Komplexität programmierbar zu machen, damit die Forscher diese gelernten Regeln für biologisches Design in einer Weise nutzen können, die bisher nicht möglich war“, fügt Hie hinzu.
Featured Image: KI-generiert via Ideogram