Forscher nutzen Deep-Learning-Algorithmen Künstliche Intelligenz entschlüsselt genetische Codes

Autor / Redakteur: Martin Hensel / Nico Litzel

Ein deutsch-amerikanisches Wissenschaftlerteam konnte mithilfe von Künstlicher Intelligenz (KI) komplexe Anweisungen der Genregulation in der DNS entschlüsseln. Zum Einsatz kam dabei ein neuronales Netzwerk.

Firma zum Thema

Erstautor Dr. Žiga Avsec bei der Arbeit.
Erstautor Dr. Žiga Avsec bei der Arbeit.
(Bild: Žiga Avsec / TUM)

Ein interdisziplinäres Forschungsteam der Technischen Universität München, des Stowers Institute for Medical Research und der Stanford University hat gezeigt, dass neuronale Netze in Verbindung mit neu entwickelten Techniken zur Modellinterpretation komplexe, in der DNS kodierte Anweisungen entschlüsseln können. Damit gehen die Wissenschaftler eines der großen ungelösten Probleme der Biologie an: den regulatorischen Code des Genoms.

Diese Abfolge der DNS-Basen enthält nicht nur Anweisungen zum Aufbau von Proteinen, sondern auch Informationen, wann und wo diese in einem Organismus hergestellt werden. Der Code wird von Proteinen („Transkriptionsfaktoren“) gelesen, die an kurze DNS-Abschnitte („Motive“) binden. Inwiefern bestimmte Kombinationen und Anordnungen von Motiven die regulatorische Aktivität beeinflussen, ist eine äußerst komplexe und bislang unlösbare Frage.

Präzise Modelle und Experimente

Für die Forscher war die die höchstmögliche Auflösung der Transkriptionsfaktor-DNS-Bindungsexperimente und Computermodellierungen ein wichtiger Erfolgsfaktor. Sie reicht bis auf die Ebene einzelner DNS-Basen. Das Team konnte so hochpräzise neuronale Netzwerkmodelle trainieren sowie Schlüsselelemente und Muster aus den Modellen extrahieren. Dies umfasste auch die Bindungsmotive für Transkriptionsfaktoren und die kombinatorischen Regeln, nach denen sie zusammen als Code fungieren.

„Neuronale Netze gelten als schwer durchschaubare Black Box, sie können aber digital befragt werden. Mit einer großen Zahl virtueller Experimente gelingt es so, die Regeln herauszufinden, die das neuronale Netz gelernt hat“, erklärt Erstautor Dr. Žiga Avsec, Mitarbeiter im Labor von Julien Gagneur, Professor für Computational Molecular Medicince an der TU München. Zusammen mit Anshul Kundaje, Professor an der Stanford University, schuf er als Gastwissenschaftler die erste Version des Modells.

Das Team wandte den Ansatz auf die Hauptregulatoren embryonaler Stammzellen der Maus an und bestätigte die Ergebnisse durch CRISPR-Genom-Edition experimentell. Die so entdeckten Muster zeigten klare Regeln, die unter anderem auf eine präzise Positionierung entlang der DNS-Doppelhelix hinwiesen und eine bevorzugte Reihenfolge der Transkriptionsfaktoren beinhalten.

Muster sichtbar machen

Zu den Ergebnissen zählt beispielsweise, dass sich ein gut untersuchter Transkriptionsfaktor namens Nanog bevorzugt an DNS bindet, wenn mehrere seiner Motive periodisch angeordnet sind und auf der derselben Seite der spiralförmigen DNS-Helix erscheinen. Diese Motivperiodizität wurde vermutet, konnte aber bislang nur schwer erfasst werden.

„Dies ist der Hauptvorteil der Verwendung neuronaler Netze für diese Aufgabe. Ein klassisches Rechenmodell basiert auf handgefertigten, starren Regeln, um sicherzustellen, dass es interpretiert werden kann “, verdeutlicht Avsec. „Die Biologie ist jedoch äußerst reich und kompliziert. Indem wir darauf verzichten, einzelne Parameter zu interpretieren, können wir viel flexiblere und vielschichtigere Modelle trainieren, die alle biologischen Phänomene erfassen, einschließlich der noch unbekannten“, so der Wissenschaftler.

Artikelfiles und Artikellinks

(ID:47159715)