Leitfaden zum Einsatz von KI Künstliche Intelligenz in der Medizin

Autor / Redakteur: Arjan van Staveren / Ira Zahorsky

In der Medizin kann Künstliche Intelligenz (KI) Großes leisten, doch ihr Einsatz ist nicht überall sinnvoll. Um zu gewinnbringenden Ergebnissen zu gelangen, ist es wichtig, bereits im Vorfeld kritisch zu hinterfragen, wo KI-Modelle genutzt werden sollten und wo nicht.

Firmen zum Thema

Künstliche Intelligenz kann bei der Auswertung medizinischer Daten in vielen Bereichen helfen.
Künstliche Intelligenz kann bei der Auswertung medizinischer Daten in vielen Bereichen helfen.
(Bild: BillionPhotos.com - stock.adobe.com)

Die Möglichkeiten, Künstliche Intelligenz in der Medizin einzusetzen, sind nahezu grenzenlos. Sie kann nicht nur Vorschläge bezüglich der besten Behandlungsmethoden machen, sondern auch Krankheiten wie Hautkrebs sind dank ihrer Hilfe bereits frühzeitig erkennbar.

Dass die Technologie diesen sogar präziser diagnostizieren kann als Dermatologen, hat eine Studie des Nationalen Centrums für Tumorerkrankungen (NCT) bewiesen: Hier traten insgesamt 157 Hautärzte aus zwölf deutschen Universitätskliniken gegen einen Algorithmus an, den Wissenschaftler des Deutschen Krebsforschungszentrums, der Universitäts-Hautklinik und des NCT gemeinsam entwickelt hatten. Die Aufgabe bestand darin, zu bewerten, ob es sich bei auf 100 Bildern gezeigten Hautauffälligkeiten um ein Melanom oder ein gutartiges Muttermal handelte. Das Ergebnis: Nur sieben Dermatologen hatte eine höhere Trefferquote als der Algorithmus. 14 von ihnen erzielten gleich gute Ergebnisse, doch die große Mehrheit von 136 Hautärzten musste sich der KI geschlagen geben. Kein Wunder also, dass immer mehr Kliniken und Gesundheitsdienstleister in die moderne Technologie investieren wollen, um ebenfalls schnellstmöglich von den Vorteilen zu profitieren.

Wo ist der Einsatz sinnvoll?

Doch es gibt einen wesentlichen Haken, den viele übersehen: Tatsächlich ist der Einsatz von Künstlicher Intelligenz nämlich nicht an jeder Stelle sinnvoll. Aus diesem Grund ist es besonders innerhalb der Medizinbranche ratsam, bereits im Vorfeld kritisch zu hinterfragen, an welcher Stelle in der Medizin KI-Modelle genutzt werden sollten und welche Vorkehrungen getroffen werden müssen, damit diese zu gewinnbringenden Ergebnissen führen. Vor allem vier wesentliche Punkte sollten dabei berücksichtigt werden:

Die Größe der verwendeten Datensätze

Künstliche Intelligenz und Machine Learning sind kein Hexenwerk. In vielen Fällen basieren sie auf denselben Ansätzen, die auch bisher Verwendung fanden. Da diese jedoch begrenzt sind und es ab einer bestimmten Größe des verwendeten Datensatzes einfach nicht mehr möglich ist, Zusammenhänge zu erfassen, lässt sich mit ihrer Hilfe die Datenverarbeitung beschleunigen und in größerem Maß durchführen. So lassen sich zum Beispiel Verbindungen zwischen Medikamenten und bestimmten Nebenwirkungen herleiten, die ohne Künstliche Intelligenz unsichtbar bleiben würden, da sonst nur einige wenige Variablen einbezogen werden könnten anstatt viele Hunderte.

Dies kann auch dazu beitragen, das Bewusstsein dafür zu schärfen, dass einige der verfügbaren Datensätze nicht genügend Informationen für genaue Diagnosen oder Vorhersagen liefern. So können Verantwortliche Lücken innerhalb der Datenstrategie aufdecken und gleichzeitig hinterfragen, ob sie zusätzliche Variablen erfassen müssen. In diesem Kontext kann es ebenso sinnvoll sein, Daten von externen Gesundheitsdienstleistern oder anderen Quellen wie zum Beispiel Datenmarktplätzen miteinzubeziehen, um dadurch die Genauigkeit des verwendeten Modells zu verbessern.

Erklärbarkeit und Leistung

Eine weitere Überlegung ist der Grad der Erklärbarkeit, der für das zu lösende Problem erforderlich ist. Wenn es beispielsweise um die KI-basierte Entscheidungsfindung in der Intensivmedizin geht, ist es nicht notwendig, jede einzelne Variable zu verstehen. Wichtig ist hier nur ein hohes Maß an Vertrauen, dass das verwendete Modell sicher ist, um im Notfall schnell eine Entscheidung treffen zu können.

Wenn es aber darum geht, eine bestimmte Krankheit richtig zu diagnostizieren oder passende Behandlungsmethoden abzuleiten, ist es wichtig, alle medizinischen Zusammenhänge zu verstehen. Die Erklärbarkeit spielt an dieser Stelle auch eine entscheidende Rolle, um ausschließen zu können, dass die KI aufgrund eines historischen Datensatzes etwaige Voreingenommenheiten ableitet. Vor allem geschlechterspezifische oder ethnische Unregelmäßigkeiten müssen erkannt und vermieden werden. Dasselbe gilt zum Beispiel auch für Menschen mit einer privaten oder gesetzlichen Krankenversicherung. Da die gewählte Behandlungsmethode nicht selten von diesem Faktor beeinflusst wird, könnte sich dies ebenfalls in den Daten widerspiegeln und dementsprechend auch die zukünftige Entscheidungsfindung der KI beeinflussen.

Die Wahl des richtigen Algorithmus

Verschiedene Algorithmen haben unterschiedliche Vor- und Nachteile. Es könnte beispielsweise der Fall sein, dass die Wahl zwischen ARIMA, ARMA, Prophet, LSTM oder einem anderen Algorithmus besteht. Doch welcher unterstützt den spezifischen Anwendungsfall am besten? Welche Unterschiede gibt es bei den Merkmalen? Wo liegen die Grenzen? Und welche Verzerrungen könnten sie mit sich bringen? Dies sind differenzierte Überlegungen, die nicht gleich gewichtet werden können und von der jeweiligen medizinischen Herausforderung abhängen, die bewältigt werden soll. Und das gilt nur für Zeitreihenprognosen. Die Zusammenarbeit mit Fachleuten und die sorgfältige Prüfung des Anwendungsfalls sind entscheidend für die Auswahl des am besten geeigneten Algorithmus.

Die Zuordnung von Fachwissen zum Problembereich ist ebenfalls ein wichtiger Faktor bei der Auswahl der richtigen Algorithmen. Welcher ausgewählt werden sollte, kann je nach den Feinheiten einer Branche oder eines Anwendungsfalls variieren. Daher ist das Wissen von Medizinern und anderen Gesundheitsexperten wichtig, um den am besten geeigneten Algorithmus für die jeweilige analytische Fragestellung zu ermitteln. Umgekehrt kann die Nichtanwendung von Fachwissen bei der Auswahl geeigneter Algorithmen zu bedeutungslosen oder sogar irreführenden Ergebnissen führen – selbst dann, wenn die Mechanik des maschinellen Lernprozesses gut ausgeführt wurde.

Die Durchführungsgeschwindigkeit

Für die meisten Unternehmen liegt der wahre Wert in den Daten und nicht in der Abstimmung des Algorithmus, weshalb es hilfreich sein kann, diesen Prozess durch AutoML-Tools zu beschleunigen. Sie ermöglichen es, eine größere Anzahl von Algorithmen mit denselben Daten zu testen und deren Leistung miteinander zu vergleichen. So können klassische Algorithmen auf viel umfangreichere Weise geprüft werden, was ein völlig neues Maß an Transparenz mit sich bringt.

A/B-Tests für die finale Wahl

Doch was ist zu tun, wenn fünf Modelle ähnlich gute Ergebnisse liefern? Auf welches sollte dann die Entscheidung fallen? Eine Möglichkeit, dieses Problem zu lösen, ist die Durchführung von A/B-Tests mit einer Teilmenge der Daten, um empirische Erkenntnisse darüber zu gewinnen, welches Modell wirklich die beste Leistung erbringt. Dies ist eine praktische MLOps-Praxis – nicht nur bei der erstmaligen Erstellung, sondern auch immer dann, wenn ein Modell oder die verwendeten Daten aktualisiert werden.

Sollten zwei oder mehr Modelle gleich gut abschneiden, besteht die beste Lösung darin, die Erklärbarkeit als Entscheidungskriterium miteinzubeziehen. Denn auf lange Sicht ist das Verständnis der Auswirkungen und der Bedeutung von Merkmalen im Kontext eines Modells nützlicher für dessen Pflege, seine Aktualisierung oder die Auswahl weiterer Trainingsdaten als die reine Schnelligkeit.

Der Autor
Arjan van Staveren ist Country Manager Germany bei Snowflake.

Bildquelle: Snowflake

(ID:47804323)