Big Data in der Forschung Datenflut bei der Genomsequenzierung

Autor / Redakteur: Tanja Palesch / Nico Litzel |

Die Einzelzellsequenzierung des menschlichen Genoms stellt große Herausforderungen an deutsche Forschungseinrichtungen. Problem sind die gigantischen Datenmengen.

Anbieter zum Thema

Die Zahl im Quartal beschäftigt sich dieses Mal mit Einzelzellsequenzierung. Dabei fallen riesige Datenmengen an.
Die Zahl im Quartal beschäftigt sich dieses Mal mit Einzelzellsequenzierung. Dabei fallen riesige Datenmengen an.
(Bild: Smart Data)

Mit einer speziellen Plattform zur Analyse will das Projekt FASTGenomics die Analyse der Daten nun vereinfachen. Die Plattform, die im Rahmen des vom Bundesministerium für Wirtschaft und Energie (BMWi) geförderten Programms „Smart Data – Innovation aus Daten“ entwickelt wird, soll einerseits nutzerfreundlich sein, andererseits hohen datenschutzrechtlichen Standards entsprechen.

Riesige Datenmengen

Hauptproblem bei der Einzelzellsequenzierung – im Gegensatz zur normalen Sequenzierung des menschlichen Genoms – sind die enormen Datenmengen. Der derzeit größte Einzelzell-Datensatz enthält 1,3 Millionen Zellen. Jede Zelle beinhaltet die vollständige DNA – beim Menschen umfasst das rund 30.000 Gene. Bei wöchentlichen Proben mit 1.500 oder mehr Zellen kommen in einer Woche leicht 50 Gigabyte an Rohdaten und mehr zusammen.

Plattform zur Datenanalyse

Mit der neuen Plattform soll die Auswertung dieser Daten nun einfacher werden. Neben der einfacheren Datenanalyse wollen die Projektentwickler damit den wissenschaftlichen Austausch fördern. So sollen Forscher eigene Daten, Algorithmen oder Workflows auf die Plattform laden und mit der wissenschaftlichen Gemeinschaft teilen können. Ein erster Prototyp der Plattform inklusive kostenfreier Demoversion steht unter https://fastgenomics.org online.

Artikelfiles und Artikellinks

(ID:44766238)