Künstliche Intelligenz gegen COVID-19 So helfen KI-Modelle und Algorithmen im Kampf gegen das Corona-Virus

Autor / Redakteur: Michael Matzer / Nico Litzel

Machine Learning ist ein bedeutendes Instrument im Kampf gegen die Corona-Pandemie. Wenn Bürger, Behörden und Unternehmen diese Gelegenheit nutzen, um Daten zu sammeln, vorhandenes Wissen zu vereinen und ihre Fachkenntnisse zusammenzubringen, können viele Leben gerettet werden – sowohl heute als auch in der Zukunft. Wie vielfältig die Einsatzgebiete von Machine Learning in diesem Rahmen sind, soll diese Übersicht zeigen, die von Data Revenue erstellt wurde.

Anbieter zum Thema

COVID-19 gelangt höchstwahrscheinlich über das Protein ACE2 in menschliche Lungenzellen. Dieser Prozess – Endozytose genannt – wird reguliert durch AAK1 (ein anderes Protein). Baricitinib hemmt AAK1 und könnte möglicherweise so auch das Eindringen von COVID-19 in die Lungenzellen verhindern.
COVID-19 gelangt höchstwahrscheinlich über das Protein ACE2 in menschliche Lungenzellen. Dieser Prozess – Endozytose genannt – wird reguliert durch AAK1 (ein anderes Protein). Baricitinib hemmt AAK1 und könnte möglicherweise so auch das Eindringen von COVID-19 in die Lungenzellen verhindern.
(Bild: Data Revenue)

Selten ist eine Epidemie derart gut dokumentiert worden wie Sars-CoV-2. Die von der dadurch ausgelösten Lungenkrankheit COVID-19 Betroffenen veröffentlichen emsig Informationen, die über den Erreger bekannt werden. Hunderte von Forschungsteams schließen sich auf der ganzen Welt zusammen, um Daten zu aggregieren, zu korrelieren und daraus Modelle für verschiedene Anwendungsfälle zu erstellen.

Machine Learning hilft mittlerweile dabei:

  • Risikogruppen zu identifizieren,
  • Patienten zu diagnostizieren,
  • Medikamente schneller zu entwickeln,
  • die Ausbreitung des Virus vorherzusagen,
  • Viren besser zu verstehen,
  • Festzustellen, woher ein Virus kommt und
  • die nächste Pandemie vorherzusagen.

Risikovorhersage

Um mögliche Opfer wie etwa in Alten- und Pflegeheimen besser schützen zu können, ist es wichtig, ihr Risiko zu berechnen und die Schutzmaßnahmen dementsprechend auszurichten und zu skalieren. ML-Modelle werden bereits erfolgreich für folgende Prognosen eingesetzt:

  • Infektionsrisiko: Wie hoch ist das Risiko, dass sich bestimmte Personen oder -gruppen mit COVID-19 anstecken? Mithilfe von Machine Learning haben Decapprio et al. beispielsweise einen ersten „Vulnerability Index“ für COVID-19 entwickelt.

Patienten-Screening und COVID-19-Diagnose

Anstatt von jedem Patienten medizinische Proben zu nehmen und auf langsame, teure Laborergebnisse zu warten, wären einfachere, schnellere und günstigere Tests nützlich, um mehr Daten sammeln zu können. Diese Daten können dann wiederum in weiteren Forschungen analysiert sowie für Triage und Screening weiterer Patienten eingesetzt werden.

In Zusammenhang mit dem Einsatz von Machine Learning zur Unterstützung der Diagnose von COVID-19 gibt es vielversprechende Forschungsbereiche:

  • Einsatz von Gesichts-Scans zur Ermittlung von Symptomen, z. B. ob der Patient unter Fieber leidet. Ein Krankenhaus in Florida geht wie folgt vor: Beim Betreten des Krankenhauses wird ein automatischer Gesichtsscan durchgeführt, der mithilfe von ML feststellt, ob ein Patient Fieber hat oder nicht.
  • Verwendung von Wearables, wie z. B. Smartwatches, um auffällige Muster im Ruhepuls von Patienten zu ermitteln. Die Apple Watch kann mit ML Herzkrankheiten erkennen und das Fitbit-Armband kann Grippesymptome ablesen. Das ist indes noch weit von COVID-19 entfernt.
  • Einsatz von Chatbots, um Screenings von Patienten anhand ihrer selbst berichteten Symptome durchzuführen. Viele Länder haben wegen Ärztemangels „Selbsttriage“-Systeme entwickelt, bei denen Patienten einen Fragebogen über ihre Symptome und Krankheitsgeschichte ausfüllen, anhand dessen sie Anweisungen darüber erhalten, ob sie zu Hause bleiben, einen Arzt anrufen oder ins Krankenhaus fahren sollen. Viele Unternehmen, darunter Microsoft, haben Chatbots bereitgestellt, die Betroffene dabei anleiten, wie sie angesichts ihrer Symptome am besten vorgehen.

Beschleunigung der Arzneimittelentwicklung

Die Suche nach einem Impfstoff ist langwierig und oft ineffizient. Bei dem Versuch, niedermolekulare Inhibitoren des Ebola-Virus zu identifizieren, entdeckten Forscher, dass mithilfe von Bayes'schen ML-Modellen der Auswertungsprozess wesentlich schneller durchgeführt werden konnte (bei der Auswertung wird jedem Molekül ein Wert zugewiesen, der angibt, wie wahrscheinlich es hilfreiche Ausprägungen besitzt). Durch diesen beschleunigten Prozess konnten sehr schnell drei potenziell wirksame Moleküle identifiziert werden.

In ähnlicher Weise entdeckten Forscher, die an der Vogelgrippe H7N9 arbeiteten, dass ML-gestütztes virtuelles Screening und Scoring zu erheblichen Verbesserungen der Genauigkeit der Scores führte. Die besten Ergebnisse für H7N9 wurden dann erzielt, wenn der sog. „Random-Forest-Algorithmus“ eingesetzt wurde.

Identifikation vorhandener wirksamer Medikamente

Machine Learning kann dabei helfen, potenzielle Arzneimittel-Kandidaten um Vieles schneller zu priorisieren, und zwar durch:

  • Aufbau einer Ontologie: Mithilfe von Natural Language Processing (NLP/Text) lassen sich eine Vielzahl von wissenschaftlichen Artikeln durchforsten und exzerpieren. Aus ihnen werden automatisch biomedizinische Ontologien erstellt, also strukturierte Netzwerke, die Einheiten wie Medikamente und Proteine sinnvoll miteinander in Beziehung setzen. Eine solche Ontologie konnte bereits auf COVID-19 angewandt werden. Der Arznei-Kandidat Baricitinib könnte das Eindringen des Virus verhindern oder zumindest hemmen.

Vorhersage der Ausbreitung von Infektionskrankheiten über soziale Netzwerke

Täglich veröffentlichen Institute und Behörden aktuelle Zahlen über das Ausmaß der Pandemie. Aber spiegeln sie auch den räumlichen Verlauf wider? Mitnichten. Problematisch ist nämlich, dass zwischen der Ansteckung mit der Krankheit, der Entwicklung erster Symptome (z. B. nach 14 Tagen) und einem positiven Testergebnis große zeitliche, aber auch räumliche Lücken bestehen können. Die Erfassung lässt sich mithilfe sozialer Medien beschleunigen und erleichtern. Doch die darin integrierten Informationen lassen sich effizient nur mithilfe von ML-Methoden wie Textanalyse (NLP, s. o.) auswerten, korrelieren, sortieren und bewerten. Dazu gehört auch die Vorhersage der Ausbreitung der Pandemie in Echtzeit und in den darauffolgenden Wochen. Anhand dieser Vorhersagen können sich medizinische Dienste darauf vorbereiten und ihre Ressourcen einteilen.

Viren anhand von Proteinen verstehen

Zu verstehen, wie ein Virus mit unserem Körper interagiert, ist essenziell für die Entwicklung neuer Behandlungsmethoden und die Erforschung neuer Medikamente. Protein-Protein Interaktionen (PPIs) zwischen Viren und menschlichen Körperzellen entscheiden über die Reaktionen unseres Körpers auf Krankheitserreger. Das Virus-Wirt-Interaktom ist das Gesamtnetzwerk der Wechselwirkungen zwischen den Proteinen eines Virus und seines Wirts. Dieses Interaktom agiert als Muster dafür, wie das Virus unseren Körper infiziert und sich in unseren Zellen vermehrt.

Viele Forschungsgruppen arbeiten daran, die große Bandbreite möglicher Wechselwirkungen zu reduzieren. ML-Modelle, die anhand von Protein-Daten trainiert wurden, konnten erfolgreich dafür eingesetzt werden, die wahrscheinlichsten Virus-Wirt-PPIs für HIV und H1N1 vorherzusagen. Das hat den Aufwand für die Erfassung des gesamten Virus-Wirt-Interaktoms erheblich reduziert.

Wie sich Proteine, die von Viren transportiert werden, falten, hat großen Einfluss auf ihre Funktion. Es ist sehr aufwendig, die Funktion einer Faltung herauszufinden.
Wie sich Proteine, die von Viren transportiert werden, falten, hat großen Einfluss auf ihre Funktion. Es ist sehr aufwendig, die Funktion einer Faltung herauszufinden.
(Bild: Data Revenue)

Vorhersagen von Proteinfaltungen: Die Struktur eines Proteinmoleküls bestimmt seine Rolle in einer Zelle. Medikamente müssen sich an die jeweilige Proteinstruktur anpassen, um zu wirken. Doch die 3D-Struktur ist meist sehr komplex. Ein Protein, das aus 100 Aminosäuren besteht, kann auf 3.100 unterschiedliche Weisen aufgebaut sein. Gleichzeitig gibt es über eine Milliarde bekannter Proteinsequenzen und es konnten bislang von nur weniger als 0,1 Prozent der Strukturen ermittelt werden. Mithilfe neuronaler Netze haben Forschergruppen erfolgreich DL-Modelle erstellt, die Proteinstrukturen vorhersagen können. Auf diese Weise wurde es mittels computergestützter Berechnungsmethoden in einem realistischen Zeitraum machbar, Proteinstrukturen zu identifizieren.

Herausfinden, wie das Virus bekämpft werden kann

Medikamente, die auf sogenannten Epitopen basieren, sind wirksamer und risikoärmer im Einsatz als andere. Epitope sind Cluster von Aminosäuren, die sich an der Außenseite eines Virus befinden. Antikörper fahnden also nach Epitopen, wodurch unser Immunsystem das Virus erkennt und vernichtet. Das Auffinden und Klassifizieren von Epitopen ist demnach essenziell, um zu entscheiden, auf welchen Teil eines Moleküls bei der Entwicklung von Impfstoffen abgezielt werden muss.

Die Suche nach dem richtigen Epitop kann ein sehr zeitaufwendiger und kostenintensiver Prozess sein. Bei einer neuartigen Pandemie wie COVID-19 beschleunigt die schnellere Lokalisierung der Epitope den Prozess der Entwicklung wirksamer Impfstoffe. Support Vector Machines (SVM), Hidden-Markov-Modelle und Deep Learning haben sich als schneller und genauer bei der Identifizierung von Epitopen erwiesen als menschliche Forscher.

Identifizierung der Wirte in der Natur

Viele Viren (links) werden von Tierarten (rechts) übertragen. Tierarten angemessen zu überwachen, kann helfen, Virenübertragungen zu unterbinden.
Viele Viren (links) werden von Tierarten (rechts) übertragen. Tierarten angemessen zu überwachen, kann helfen, Virenübertragungen zu unterbinden.
(Bild: Data Revenue)

COVID-19 stammt aus dem Tierreich. Viren wie COVID-19, Ebola, HIV oder die Hühnergrippe können in der Natur lange Zeit unbemerkt überleben, während sie auf die nächste Mutation – und damit auf die nächste Gelegenheit, sich auch auf den Menschen auszubreiten – warten. Mithilfe von ML-Methoden lassen sie sich weit schneller aufspüren als mit herkömmlichen Ansätzen.

Dank enormer technologischer Fortschritte ist das sogenannte Whole-Genome Sequencing (WGS, Prozess des Bestimmens des kompletten Erbguts eines Organismus) kostengünstig und schnell geworden. Forschungsergebnisse haben gezeigt, dass ML-Modelle WGS-Daten nutzen können, um in Kombination mit Expertenwissen diejenigen Arten zu bestimmen, die am wahrscheinlichsten als Wirt für die Krankheit in Frage kommen. Ist der Erreger in der Natur lokalisiert, lassen sich Schutzmaßnahmen ergreifen.

Die nächste Pandemie vorhersagen

Analog zu gut untersuchten Gruppeviren ist es auch bei Sars-CoV-2 essenziell, einen potenziellen Erreger, der dem Menschen gefährlich werden kann, zu identifizieren. Nicht alle Viren können auf den Menschen überspringen, aber die erfolgreichen Angreifer müssen schnellstmöglich bestimmt und geortet werden können.

Forscher, die sich mit Influenza A befasst haben, extrahierten 67.940 Proteinsequenzen aus einer Datenbank und filterten diese Sequenzen so, dass der Datensatz nur noch diejenigen Influenzastämme mit vollständigen Sequenzen von elf Influenza-Proteinen enthielt. Basierend auf ML-Modellen waren die Forscher dann dazu in der Lage, potenziell zoonotische Influenzastämme mit hoher Treffsicherheit zu identifizieren. Das Verfahren ließe sich im Ernstfall auch auf Corona-Viren wie Sars-CoV-2 anwenden. Man sieht also: KI-Disziplinen wie Data Mining, Machine Learning und Deep Learning (NLP etc.) beschleunigen und erleichtern die Bekämpfung der Pandemie.

Artikelfiles und Artikellinks

(ID:46564358)