Graphdatenbank beim ICIJ im Einsatz Paradise Papers wurden mit Neo4j analysiert
Für die Datenanalyse der Paradise Papers nutzt das International Consortium of Investigative Journalists (ICIJ) die Graphdatenbank Neo4j. Sie hilft bei der Bewältigung von rund 13,4 Millionen Dokumenten.
Anbieter zum Thema

Derzeit müssen sich Steuertrickser, Briefkastenfirmen und Nutzer von Steueroasen warm anziehen – denn über das 1,3 Terabyte große Datenleak namens Paradise Papers gelangen zahlreiche Namen und Details an die Öffentlichkeit. Das Datenpaket wurde der „Süddeutschen Zeitung“ zugespielt und wird in Zusammenarbeit mit dem International Consortium of Investigative Journalists (ICIJ) und einem globalen Journalistennetzwerk ausgewertet. Dazu wurden die Rohdaten zunächst in eine Datenbank überführt, die nun mtihilfe der Graphplattform Neo4j ausgewertet wird. In Kombination mit dem Visualisierungstool Linkurious lassen sich die Daten strukturieren, anschaulich darstellen und analysieren. Die beteiligten Journalisten konnten so versteckte Zusammenhänge zwischen Personen, Unternehmen und Offshore-Konten aufdecken.
Datenmodellierung als Hilfestellung
„Bei einem Großteil der Dokumente handelte es sich um Rohdaten. Diese in einer einzigen Datenbank zu speichern, war für uns zunächst eine Herausforderung“, erklärt Pierre Romera, Chief Technology Officer des ICIJ. „Mit Neo4j und Linkurious konnten unsere Entwickler schließlich den Datensatz auf eine Weise modellieren, die es den 382 Journalisten ermöglichte, die Daten zu analysieren, Muster zu visualisieren und sich auszutauschen. Es ist erstaunlich, wie intuitiv eine Graphdatenbank dabei ist – unabhängig von der jeweiligen IT-Erfahrung der Anwender. Das vereinfachte die Analyse und bereitete den Weg für die nun veröffentlichten Berichte“, erläutert er die Hintergründe. In einem Video-Interview erklärt Neo4j-CEO Emil Eifrem weitere Hintergründe zur Technik hinter der Analyse der Paradise Papers.
(ID:45010029)