TUM und Helmholtz Munich forschen gemeinsam KI-Lösungen für die medizinische Spitzenforschung

Von Martin Hensel |

Daten sind nicht nur für die Wirtschaft von essentieller Bedeutung, sondern bringen auch die biomedizinische Forschung voran. Mit dem Computational Health Center des Forschungszentrums Helmholtz München entsteht nun in enger Kooperation mit der Technischen Universität München (TUM) eines der europaweit größten Forschungszentren für KI in der medizinischen Wissenschaft.

Anbieter zum Thema

CellRank-Wahrscheinlichkeiten für die Regeneration der Lunge. Jede Zelle ist an einer Position platziert, die ihre Wahrscheinlichkeit widerspiegelt, einen beliebigen Endzustand zu erreichen.
CellRank-Wahrscheinlichkeiten für die Regeneration der Lunge. Jede Zelle ist an einer Position platziert, die ihre Wahrscheinlichkeit widerspiegelt, einen beliebigen Endzustand zu erreichen.
(Bild: Helmholtz Munich / Marius Lange)

Mehr als hundert Wissenschaftler werden dort mithilfe von KI und maschinellem Lernen nach Lösungen für schnellere Datenverarbeitung und höhere Datenqualität forschen. Das soll zu medizinischen Innovationen für eine gesündere Gesellschaft führen. In der aktuellen Ausgabe des Fachjournals Nature Methods wurden nun bereits erste Ergebnisse vorgestellt.

Datenintegrationsprobleme lösen

Forscher arbeiten in wissenschaftlichen Studien oft an einzelnen Datensätzen. Diese müssen später mit anderen Datensätzen aus demselben System verglichen werden, um eine mögliche Verallgemeinerung der Ergebnisse zu prüfen. In der medizinischen Forschung geht es dabei häufig um Daten einzelner Zellen. Da Einzelzelldaten nicht immer zur gleichen Zeit, am gleichen Ort oder von der gleichen Person erzeugt wurden, unterscheiden sich auch die Zelltypen in ihrem molekularen Profil. Dieses Problem („Batch-Effekt“) erschwert die Kombination von Datensätzen immens.

Die Wissenschaftler haben deshalb 16 der gängigsten Lösungen für die Datenintegration anhand von 13 Aufgaben vergleichen. Nach über 55.000 Stunden Rechenzeit und der detaillierten Auswertung von 590 Ergebnissen konnten sie einen Leitfaden erstellen, mit dessen Hilfe sich das Dilemma der Datenintegration optimal lösen lässt. Im Ergebnis ermöglicht dies eine bessere Beobachtung von Krankheitsprozessen über unterschiedliche Datensätze hinweg.

Zellschicksal per Open Source Software prognostizieren

Eine weitere Frage der medizinischen Forschung betrifft die Zellentwicklung und -regeneration. Hierbei ist die Genexpression von Zellen wesentlich, die mittels einer Methode namens Einzelzell-RNA-Sequenzierung ermittelt wird. Dabei wird die Zelle allerdings zerstört, lediglich eine kurze Momentaufnahme der Genexpression ist möglich. Es existieren bereits Algorithmen, um auf dieser Basis künstlich auf einen kontinuierlichen Entwicklungsprozess zu schließen. Verlässliche Aussagen zum Schicksal der Zelle sind aber nicht möglich.

Im Computational Health Center wird deshalb an einem neuen Algorithmus namens CellRank gearbeitet. Er kombiniert die Momentaufnahme der Genexpression mit einem Konzept zur Abschätzung der Genregulation („RNA Velocity“). Sowohl in vitro als auch in vivo konnte dieses Verfahren das Schicksal von Zellen korrekt vorhersagen und bekannte Gene wiedererkennen. In einem Beispiel zur Lungenregeneration konnte CellRank neuartige Zellzwischenzuständige vorhersehen, deren Existenz später experimentell bestätigt wurde. CellRank selbst ist Open-Source-Software, die in Laboren weltweit zum Einsatz kommt.

Mit Squidpy stellten Forscher des Instituts zudem eine Software vor, die zur Verarbeitung räumlicher Genexpressionsdaten dient. Sie bietet Tools für Genexpressions- und Bildanalyse, um räumliche Omics-Daten effizient zu bearbeiten und zu visualisieren. Squidpy ist erweiterbar und kann mit Tools für maschinelles Lernen auf dem Python-Ökosystem verbunden werden. Die Lösung wird bereits weltweit genutzt, um räumliche molekulare Daten zu analysieren.

(ID:47988277)