Datenanalysen und -aufbereitung in Zeiten der Coronakrise Snowflake stellt aufbereitete COVID-19-Falldaten von Starschema zur Verfügung
Anbieter zum Thema
In Zeiten der Corona-Pandemie sind wir alle süchtig nach Zahlen. Einen begehrten Datensatz mit aktuellen Fallzahlen stellt die angesehene Johns-Hopkins-Universität zur Verfügung. Hunderte oder gar tausende Datenanalysten verlassen sich auf diese Daten. Dieser Datensatz und das Dashboard wurden aber nicht für die direkte Datenanalyse entwickelt. Um die Zahlen zu analysieren, müssen Datenwissenschaftler sie zuerst entsprechend aufbereiten.

Diesen Schritt möchte die Cloud-Data-Plattform Snowflake gemeinsam mit dem Tech-Unternehmen Starschema vereinfachen: Die beiden Unternehmen führen epidemiologische Daten aus verschiedenen Quellen (u. a. der Johns-Hopkins-Universität) zu einer einheitlichen, kohärenten Informationsquelle zusammen.
Single Source of Truth
Starschema bietet damit einen allgemeingültigen Datenbestand an, auf den sich alle Nutzer verlassen können. Ihr Ziel ist es, Daten von höchster Qualität zu liefern, die solide genug sind, um Leben zu retten – und das bei größtmöglicher Transparenz. Die Daten werden hierfür ständig aktualisiert, abgeglichen, bereinigt und auf Redundanz untersucht. In der Fachsprache des Datenmanagements nennt man so eine Datenquelle die „Single Source of Truth“. Darüber hinaus lassen sich diese Daten mit relevanten Informationen wie Bevölkerungsdichte und Geolokalisierung erweitern.
Anwender erhalten damit Zugang zu Daten in einem einfach verwendbaren, analysefähigen Format und können somit schnell neue Modelle und Anwendungen erstellen. Dadurch können Organisationen mithilfe der Daten Notfallpläne bewerten und in Echtzeit fundierte datengestützte Entscheidungen treffen, um auf den globalen Gesundheitsnotfall zu reagieren.
Hier ein paar Beispiele:
- Gesundheitsbehörden erhalten Zugang zu phylogenetischen Studien, um zu ermitteln, ob bestimmte Stämme von Sars-CoV-2, dem Virus, der COVID-19 verursacht, ein höheres Risiko bergen.
- Neben den Daten zur Kapazität des Gesundheitswesens kann der Datensatz zur Identifizierung von Krankenhäusern verwendet werden, bei denen die Gefahr besteht, dass die Kapazität erreicht oder überschritten wird, sodass unkritische Patienten umgeleitet oder verlegt werden können, bevor die Einrichtung ihre Kapazität erreicht.
- Regierungen können fundierte datengestützte Entscheidungen für die zivile Notfallplanung auf der Grundlage von Daten aus Nachbarländern treffen.
- Einzelhändler können den Datensatz verwenden, um proaktiv auf eine erhöhte Marktnachfrage zu reagieren und um Bereiche zu identifizieren, die anfällig für Lieferengpässe sind.
- Finanzinstitutionen können die Daten nutzen, um Rückschlüsse auf mögliche Ausfallrisiken zu ziehen und frühzeitig Strategien zur Milderung der Folgen zu entwickeln, um ihren Kunden in dieser schwierigen Zeit zu helfen.
Im weiteren Verlauf der Corona-Krise will Starschema den COVID-19-Inzidenzdatensatz im Snowflake Data Exchange mit weiteren Daten, zum Beispiel zu lokalen Notfallmaßnahmen, sowie mit demografischen Informationen für betroffene Regionen und zusätzlichen Berichtsebenen aus Regionen, Staaten und Ländern, erweitern. Es ist davon auszugehen, dass Daten mit dem Fortschreiten der COVID-19-Pandemie sowohl bei öffentlichen als auch bei privaten Organisationen eine immer wichtigere Rolle spielen werden.
Bereitstellung über Snowflake Data Exchange
Snowflake Data Exchange ist ein öffentlicher Marktplatz, der auf Snowflakes Technologie für den sicheren Datenaustausch aufbaut. So können Nutzer auf Daten zugreifen, die Snowflake Daten-Anbieter öffentlich zur Verfügung stellen. Starschema nutzt den Data Exchange um einfach, nahtlos und nahezu in Echtzeit Daten zu Covid-19 für den öffentlichen und privaten Bereich zur Verfügung zu stellen. Organisationen können sich von ihrem Snowflake-Konto aus mit dem Data Exchange verbinden, um den COVID-19-Inzidenzdatensatz nahtlos zu integrieren und Abfragen schneller zu bearbeiten.
Artikelfiles und Artikellinks
(ID:46491705)