Graphdatenbank beim ICIJ im Einsatz

Paradise Papers wurden mit Neo4j analysiert

| Autor / Redakteur: Martin Hensel / Nico Litzel

Bei der Analyse der Paradise Papers greift das ICIJ auf Neo4j zurück.
Bei der Analyse der Paradise Papers greift das ICIJ auf Neo4j zurück. (Bild: Neo4j / ICIJ)

Für die Datenanalyse der Paradise Papers nutzt das International Consortium of Investigative Journalists (ICIJ) die Graphdatenbank Neo4j. Sie hilft bei der Bewältigung von rund 13,4 Millionen Dokumenten.

Derzeit müssen sich Steuertrickser, Briefkastenfirmen und Nutzer von Steueroasen warm anziehen – denn über das 1,3 Terabyte große Datenleak namens Paradise Papers gelangen zahlreiche Namen und Details an die Öffentlichkeit. Das Datenpaket wurde der „Süddeutschen Zeitung“ zugespielt und wird in Zusammenarbeit mit dem International Consortium of Investigative Journalists (ICIJ) und einem globalen Journalistennetzwerk ausgewertet. Dazu wurden die Rohdaten zunächst in eine Datenbank überführt, die nun mtihilfe der Graphplattform Neo4j ausgewertet wird. In Kombination mit dem Visualisierungstool Linkurious lassen sich die Daten strukturieren, anschaulich darstellen und analysieren. Die beteiligten Journalisten konnten so versteckte Zusammenhänge zwischen Personen, Unternehmen und Offshore-Konten aufdecken.

Datenmodellierung als Hilfestellung

„Bei einem Großteil der Dokumente handelte es sich um Rohdaten. Diese in einer einzigen Datenbank zu speichern, war für uns zunächst eine Herausforderung“, erklärt Pierre Romera, Chief Technology Officer des ICIJ. „Mit Neo4j und Linkurious konnten unsere Entwickler schließlich den Datensatz auf eine Weise modellieren, die es den 382 Journalisten ermöglichte, die Daten zu analysieren, Muster zu visualisieren und sich auszutauschen. Es ist erstaunlich, wie intuitiv eine Graphdatenbank dabei ist – unabhängig von der jeweiligen IT-Erfahrung der Anwender. Das vereinfachte die Analyse und bereitete den Weg für die nun veröffentlichten Berichte“, erläutert er die Hintergründe. In einem Video-Interview erklärt Neo4j-CEO Emil Eifrem weitere Hintergründe zur Technik hinter der Analyse der Paradise Papers.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45010029 / Analytics)