Definition Was ist GDELT?

GDELT ist eine frei zugängliche Datenbank, die weltweit Ereignisse und Nachrichten erfasst, speichert und für Analysezwecke bereitstellt. Seit 1979 sammelt das GDELT-Projekt die Daten zahlreicher Print-, Online- und Broadcast-Medien in mehr als 100 verschiedenen Sprachen. Die Daten sind auch über die Google Cloud Platform (GCP) verfügbar und lassen sich mit Google BigQuery auswerten.

Anbieter zum Thema

(Bild: © aga7ta - stock.adobe.com)

GDELT ist das Akronym für „Global Database of Events, Language and Tone“. Es handelt sich um ein von Kalev Leetaru und der Georgetown-Universität in Washington ins Leben gerufene Projekt, das Nachrichten und Ereignisse weltweit sammelt und in einer Datenbank speichert. Die Daten sind frei zugänglich und für verschiedene Zwecke nutzbar. Beispielsweise lassen sich anhand erkannter Muster regionale oder globale Entwicklungen ableiten oder vorhersagen.

Datenquellen für GDELT sind Zeitungen sowie Online-, Print- und Broadcast-Medien. Dazu gehören beispielsweise Africanews, Agence France-Presse, (AFP) Associated Press, BBC Monitoring, Christian Science Monitor, Facts on File, Foreign Broadcast Information Service (FBIS), The New York Times, United Press International, The Washington Post und viele mehr. Die Einträge der Datenbank reichen von heute bis in das Jahr 1979 zurück. Es kommen ständig neue Nachrichten und Ereignisse in über 100 verschiedenen Sprachen dazu. Auch Nachrichtenbilder werden vom GDELT-Projekt erfasst. Über eine Viertel-Milliarde Event-Records in über 300 Kategorien sind in der Datenbank gespeichert und lassen sich über ihre Beziehungen mit Netzwerkdiagrammen verknüpfen und visualisieren.

Die Daten sind auch über die Google Cloud Platform (GCP) verfügbar und lassen sich mit Google BigQuery auswerten. Prinzipiell bestehen drei verschiedene Möglichkeiten auf die Daten von GDELT zuzugreifen und sie zu analysieren. Das sind der GDELT Analysis Service, Google BigQuery oder der Download der Rohdaten. Rohdaten sind für verschiedene Zeiträume als ZIP-Files im CSV-Format verfügbar und lassen sich beispielsweise in eigene Datenbanken, in tabellenbasiert arbeitende Tools oder in andere Anwendungen laden und dort verarbeiten. Für das Sammeln, Speichern und Auswerten der Daten kommen Methoden, Tools und Lösungen der Künstlichen Intelligenz (KI), des Machine Learnings (ML) und des Big-Data-Umfelds zum Einsatz.

Die Vision von GDELT

Entstanden ist das GDELT-Projekt aus dem Wunsch heraus, die globale Gesellschaft, ihre Beziehungen untereinander und weltweite Entwicklungen in Echtzeit zu monitoren und sie besser zu verstehen. GDELT sammelt die hierfür notwendigen Daten aus frei verfügbaren Quellen und hält sie in einem lesbaren und analysierbaren Format bereit. Es soll eine Datenbasis mit Verknüpfungen entstehen, die erfasst, was weltweit geschieht, was die Hintergründe sind, wer beteiligt ist und wie die Gesellschaft darüber denkt.

Mithilfe der gesammelten und bereitgestellten Daten sollen Muster erkennbar werden, an denen sich Entwicklungen und Trends ablesen oder vorhersagen lassen. Ein Grundgedanke dabei ist, dass sich Geschichte wiederholt und bestimmte Entwicklungen vorhersagbar sind. GDELT möchte dazu beitragen, Theorien über das Verhalten der Gesellschaft und über die treibenden globalen Kräfte zu entwickeln. Beispielsweise ist es eine Vision der Gründer von GDELT, zukünftige Krisen, Unruhen oder Revolten aufzuspüren.

Die Funktionsweise von GDELT

Um eine große Zahl an Medien zu überwachen, abzufragen und Ereignisse auf der ganzen Welt zu sammeln, nutzt GDELT verschiedene Algorithmen. GDELT erzeugt unterschiedliche Datenstreams. Datenstreams sammeln weltweite Aktivitäten in über 300 Kategorien und legen sie systematisch ab. Sie erfassen die beteiligten Personen, Orte, Organisationen und Emotionen sowie ihre Beziehungen untereinander und sorgen auch für die systematische Erfassung der Bilderwelt. Die Streams werden alle 15 Minuten aktualisiert. In der GDELT Event Database sind die weltweiten physischen Ereignisse in über 300 Kategorien erfasst. Für jedes Ereignis können bis zu 60 Attribute inklusive der Orte der Ereignisse aufgezeichnet werden. Darüber hinaus stehen weitere Informationsquellen wie der GDELT Global Knowledge Graph (GKG) und der GDELT Visual Global Knowledge Graph zur Verfügung, mit denen sich die Daten und ihre Beziehungen visualisieren lassen.

Nutzung von GDELT

Die vom GDELT-Projekt bereitgestellten Daten sind kostenlos und frei zugänglich. Sie lassen sich unbeschränkt für kommerzielle, wissenschaftliche oder behördliche Zwecke nutzen. Die Daten dürfen mit Hinweis und Verlinkung auf das GDELT-Projekt in jeglicher Form selbst gehostet oder neu organisiert bereitgestellt werden. Sie sind als Rohdateien zum Download verfügbar. Darüber hinaus sind der GDELT Analysis Service oder Google BigQuery nutzbar.

Der GDELT Analysis Service ist ein cloudbasiert arbeitender Dienst. Mithilfe verschiedener Tools lassen sich die Daten der GDELT Event Database und des GDELT Global Knowledge Graph untersuchen, die Informationen visualisieren und die Ergebnisse exportieren. Zu diesen Tools zählen beispielsweise der Event Exporter, Event Geographic Network, Event Heatmapper, Event Timemapper, GKG Network, GKG Heatmap, GKG Exporter, GKG Word Cloud, GKG Thematic Timeline und einige mehr. Zur Nutzung des GDELT Analysis Service ist kein spezielles technisches Know-how notwendig.

Die komplette GDELT Event Database ist auch in Google BigQuery verfügbar. Das Abfragen, Analysieren, Modellieren und Exportieren von Daten ist über SQL in nahezu Echtzeit möglich.Fortgeschrittene Anwender können die Rohdaten der GDELT Event Database im CSV-Format herunterladen. Diese Daten lassen sich mit entsprechendem Know-how beliebig in eigenen Anwendungen weiterverarbeiten, analysieren oder visualisieren.

Artikelfiles und Artikellinks

(ID:47842339)