Big Data in der Forschung Datenflut bei der Genomsequenzierung
Die Einzelzellsequenzierung des menschlichen Genoms stellt große Herausforderungen an deutsche Forschungseinrichtungen. Problem sind die gigantischen Datenmengen.
Anbieter zum Thema

Mit einer speziellen Plattform zur Analyse will das Projekt FASTGenomics die Analyse der Daten nun vereinfachen. Die Plattform, die im Rahmen des vom Bundesministerium für Wirtschaft und Energie (BMWi) geförderten Programms „Smart Data – Innovation aus Daten“ entwickelt wird, soll einerseits nutzerfreundlich sein, andererseits hohen datenschutzrechtlichen Standards entsprechen.
Riesige Datenmengen
Hauptproblem bei der Einzelzellsequenzierung – im Gegensatz zur normalen Sequenzierung des menschlichen Genoms – sind die enormen Datenmengen. Der derzeit größte Einzelzell-Datensatz enthält 1,3 Millionen Zellen. Jede Zelle beinhaltet die vollständige DNA – beim Menschen umfasst das rund 30.000 Gene. Bei wöchentlichen Proben mit 1.500 oder mehr Zellen kommen in einer Woche leicht 50 Gigabyte an Rohdaten und mehr zusammen.
Plattform zur Datenanalyse
Mit der neuen Plattform soll die Auswertung dieser Daten nun einfacher werden. Neben der einfacheren Datenanalyse wollen die Projektentwickler damit den wissenschaftlichen Austausch fördern. So sollen Forscher eigene Daten, Algorithmen oder Workflows auf die Plattform laden und mit der wissenschaftlichen Gemeinschaft teilen können. Ein erster Prototyp der Plattform inklusive kostenfreier Demoversion steht unter https://fastgenomics.org online.
Artikelfiles und Artikellinks
(ID:44766238)