Integration medizinischer Forschungsdaten HUMIT schärft den Blick für neue Zusammenhänge mit Big Data

Redakteur: Manfred Klein

In der klinischen Forschung und der Medikamenten-Entwicklung generieren Wissenschaftler rasant zunehmende Datenmengen, die sie nur schwer mit älteren Studien, anderen Experimenten oder externen Datenbanken abgleichen können. Abhilfe will das jetzt gestartete Projekt HUMIT unter Leitung von Fraunhofer FIT bringen.

Firmen zum Thema

Analysen in der biomedizinischen Hochdurchsatzforschung erfordern die Integration umfangreicher heterogener Datenquellen
Analysen in der biomedizinischen Hochdurchsatzforschung erfordern die Integration umfangreicher heterogener Datenquellen
(Bild: © WavebreakmediaMicro - Fotolia)

Durch innovative Big-Data-Methoden sollen nun durch die Kombination alter und neuer Daten weiterführende Erkenntnisse erschlossen werden. Im Projekt HUMIT haben sich dazu vier Akteure im Bereich Wirkstoffforschung zur Medikamentenentwicklung zusammengeschlossen.

Das Fraunhofer-Institut für Molekularbiologie und Angewandte Ökologie IME etwa führt als Pharmadienstleister Hochdurchsatzexperimente auf der Suche nach neuen Wirkstoffen durch. In den bereits gesammelten Daten stecken viele Informationen, die auch für andere Fragestellungen genutzt werden könnten.

Das Deutsche Zentrum für Neurodegenerative Erkrankungen (DZNE) sammelt ebenfalls viele Experimentaldaten bei der Erforschung der Ursachen von Alzheimer und Parkinson, kann das Material aber nicht umfassend mit den weltweiten Forschungsdatenbanken abgleichen.

Zusammen mit dem Fraunhofer-Institut für Angewandte Informationstechnik FIT und dem Laborinformationssystem-Anbieter soventec GmbH wollen die Partner nun Wege finden, wie die vielfältigen Informationen in Zukunft besser integriert und genutzt werden können, um komplexe Krankheiten besser zu verstehen und die Wirkungen und Nebenwirkungen von Substanzen klarer zu erfassen.

Die zentrale Herausforderung ist die hohe Heterogenität biomedizinischer Daten. Experimentalansätze und Modelle ändern sich in der Forschung sehr schnell und damit auch die Datenstrukturen. HUMIT will neue Methoden entwickeln, die es einem Nutzer ermöglichen, interaktiv aus den vorhandenen Daten die Struktur zu erkennen und mit anderen Strukturen zusammenzubringen.

Hauptidee ist dabei ein inkrementelles Vorgehen, bei dem die Regeln zur Integration der Daten schrittweise definiert werden und das Informationssystem schon früh ohne aufwändige Konfigurationsarbeiten genutzt werden kann. Gleichzeitig soll der Forscher die ultimative Kontrolle über Form und Interpretation seiner Daten behalten.

„Auch wenn wir uns vornehmlich der vorklinischen Forschung widmen, betrachten wir auch die Integration von Patientendaten und sorgen dafür, dass die hohen Anforderungen an Sicherheit und Privatsphäre solcher Daten durch Big-Data-Ansätze nicht unterlaufen werden“, so Projektkoordinator Dr. Christoph Quix, Leiter der Abteilung für High-Content-Analyse und informationsintensive Instrumente beim Fraunhofer-Institut für Angewandte Informationstechnik FIT.

Analysen in der biomedizinischen Hochdurchsatzforschung erfordern die Integration umfangreicher heterogener Datenquellen (Experimente, Archive, Fachdatenbanken). Existierende Werkzeuge zur Datenintegration und -analyse von biomedizinischen Daten sind nicht ausreichend flexibel und ausdrucksstark, weil sich Fragestellungen und Datenquellen ständig weiterentwickeln und Informationen durch Benutzer semantisch interpretiert und angepasst werden müssen.

Ein Big-Data-Ansatz, der es Wissenschaftlern besser als bisher ermöglicht, domänenübergreifende Analysen von Hochdurchsatzexperimenten zu steuern und zu bewerten, soll einen wesentlichen positiven Effekt auf die Forschungs- und Entwicklungsfähigkeit des Standortes Deutschland in den Life Sciences haben.

Der Wert der erhobenen Daten wird wesentlich gesteigert, gleichzeitig wird das Potenzial der Hochdurchsatzforschung erhöht, um Krankheitsursachen zu erkennen und die richtigen Therapien zu finden.

Die Hauptideen des vorgeschlagenen Ansatzes sind ein inkrementelles Vorgehen bei der Definition von Datenmodellen und Integrationsregeln sowie die Trennung der Rohdatenspeicherung von der Datenaufbereitung für die Analyse.

Dabei wird die Interaktion mit dem Benutzer als ein zentrales Element in den Datenverarbeitungsprozess mit eingebunden. Die Verwertung der Projektergebnisse in einem Dienstleistungsszenario oder eine Vermarktung einzelner Komponenten ist aufgrund des hohen Bedarfs für Big-Data-Lösungen in den Life Sciences vorgesehen.

HUMIT (Human-zentrierte Unterstützung inkrementell-interaktiver Datenintegration am Beispiel von Hochdurchsatzprozessen in den Life Sciences) adressiert sowohl Anwender in kleinen und großen Pharmafirmen als auch in den öffentlichen Forschungseinrichtungen. Das Projekt wird vom Bundesministerium für Bildung und Forschung gefördert.

Artikelfiles und Artikellinks

Link: HUMIT im Web

(ID:43452964)