Suchen

Datenanalyse mit Open Source Software Das kann GNU PSPP

Autor / Redakteur: Thomas Joos / Nico Litzel

Die Open Source Software PSPP stellt einen kompatiblen Ersatz für die Analyse-Software SPSS dar. Die Funktionen sind zwar etwas eingeschränkt, aber die Datenbasis ist identisch.

Firmen zum Thema

Die Open Source Software PSPP ist ein freier Ersatz für das proprietäre Programm IBM SPSS und wird von Datenwissenschaftlern und Studenten geschätzt.
Die Open Source Software PSPP ist ein freier Ersatz für das proprietäre Programm IBM SPSS und wird von Datenwissenschaftlern und Studenten geschätzt.
(Bild: © monsitj - stock.adobe.com)

GNU PSPP ist ein Open Source-Programm zur statistischen Analyse von Daten. Das Tool ist ein freier Ersatz für das proprietäre Programm IBM SPSS. GNU PSPP steht für Windows, Linux und macOS zur Verfügung. Vor allem Datenwissenschaftler und Studenten setzen auf die freie Alternative von SPSS. Im Gegensatz zu SPSS gibt es bei PSPP auch keine Begrenzung der zu verwendeten Variablen. Allerdings darf nicht vergessen werden, dass PSPP eine kostenlose Software ist, die in Konkurrenz zu einer seit Jahren weiterentwickelten, professionellen Software steht. Einige Funktionen und Analysen sind in PSPP nicht verfügbar. Ob der Funktionsumfang für die eigenen Anforderungen ausreicht, sollte im Bedarfsfall getestet werden. Wer sich mit SPSS auskennt, kommt mit PSPP schnell zurecht.

Das kostenlose Open Source Tool ist in der Lage, ohne Umwandlung mit SPSS-Daten zu arbeiten oder verarbeitete Daten in das SPSS -Format zu exportieren. Generell kann GNU PSPP also durchaus auch parallel zu SPSS eingesetzt werden, wenn auf einem Computer zum Beispiel aktuell keine Lizenz von SPSS zur Verfügung steht. Die Bedienoberfläche ist sehr ähnlich zueinander, das gilt auch für das Datenfenster und das Variablenfenster

Das Tool verhält sich ähnlich wie SPSS, ist vom Funktionsumfang aber eingeschränkt. Allerdings ist das Tool dauerhaft kostenlos nutzbar. Es verliert keinerlei Funktion oder hat zeitliche Grenzen für die Nutzung. Die Entwickler geben an, dass keine zusätzlichen Pakete oder Erweiterungen für das Tool geplant sind und alle Kernfunktionen von SPSS in PSPP enthalten sind.

PSPP bietet eine grafische Oberfläche und steht für Windows, Linux und macOS zur Verfügung.
PSPP bietet eine grafische Oberfläche und steht für Windows, Linux und macOS zur Verfügung.
(Bild: T. Joos)

GNU PSPP als Ersatz zu IBM SPSS nutzen

GNU PSPP kann verschiedene Daten importieren und als SPSS-Format oder in ASCII ausgeben. Zu den unterstützten Importdaten gehören Tabellenkalkulationen (Excel, Gnumeric, OpenDocument), CSV- und ASCII-Dateien, sowie Daten aus Postgres. Im Fokus des Tools stehen statistische Analysen. PSPP soll die lizenztechnischen Probleme von SPSS umgehen, und dauerhaft kostenlose Analysen von Statistikdaten erlauben. PSPP ist in der Lage, Datensätze von SPSS ohne weitere Umwandlung zu öffnen (SAV-Dateien). Auch Syntax-Dateien (*.sps) können mit PSPP geöffnet oder importiert werden.

GNU PSPP kann deskriptive Statistiken, T-Tests, Anova, lineare und logistische Regression, Assoziationsmaße, Clusteranalyse, Zuverlässigkeits- und Faktorenanalyse, nichtparametrische Tests und mehr durchführen. PSPP bietet eine grafische Oberfläche, kann aber auch in der Befehlszeile genutzt werden.

Die grafische Oberfläche steht in Windows, Linux und macOS zur Verfügung. Die Installation auf Windows-PCs wird normalerweise über den Windows-Installer abgewickelt.

Die Installation auf Linux ist ebenfalls nicht sehr kompliziert. Vor der obligatorischen Aktualisierung mit

sudo apt-get update -y

erfolgt die Installation mit

sudo apt-get install -y psp

Mit PSPP arbeiten

Generell ist es relativ problemlos möglich Daten in PSPP zu importieren und in verschiedenen Formaten zu exportieren. Im Datenfenster können Zahlencodes und deren Beschriftung getrennt voneinander gepflegt werden. Mit dem Dateneditor können statistische Daten daher einfacher und komfortabler eingegeben oder verwaltet werden.

Daten mit PSPP analysieren
Daten mit PSPP analysieren
(Bild: T. Joos)

Der Aufbau der Menüs ist ähnlich zu den Möglichkeiten in SPSS. Um Daten zu untersuchen, stehen die verschiedenen Punkte im Menü „Analysieren“ zur Verfügung. Der Aufbau entspricht auch hier dem von SPSS. Wer mit der grafischen Oberfläche von PSPP arbeitet, muss die PSPP-Syntax aus dem Terminal/Eingabeaufforderung nicht kennen. Hier sind alle Befehle in den bereits erwähnten Menüs verfügbar. Daten können über die Tastatur eingegeben oder aus Tabellenkalkulationsprogrammen ausgeschnitten und eingefügt werden. Auch das Importieren aus Dateien ist möglich. Die grafische Oberfläche wird in Windows entweder über die Verknüpfung des Programmes gestartet oder in Linux und macOS mit dem „psppire.exe“.

Die Datenansicht wird nach dem Start von PSPP automatisch angezeigt. Diese Ansicht zeigt die Daten in einer Tabelle an, die ähnlich wie eine Tabellenkalkulation funktioniert. Wenn eine Analyse abgeschlossen ist, kann ein weiteres Fenster geöffnet werden, das die Daten der Analyse anzeigt. PSPP verwendet in der Datenansicht Zahlen, Buchstaben, Wörter oder andere Daten. Es werden keine Formeln in die Zellen der Datenansicht eingegeben. Die Analysen werden über das bereits erwähnt Menü „Analysieren“ gestartet.

PSPP kann aber auch aus dem Terminal oder in der Eingabeaufforderung verwendet werden. Der Vorteil besteht darin, dass sich dadurch das Programm auf die Analyse fokussieren kann und keine grafischen Objekte bei der Berechnung stören. Die Shell von PSPP kann in Windows über das Installationsverzeichnis mit „pspp.exe“ aufgerufen werden. Die Datei befindet sich im Unterverzeichnis „bin“.

Daten visualisieren und bearbeiten

PSPP kann Diagramme aus den Daten erzeugen. Hier stehen zum Beispiel Box-and-Whisker-Plots, Normalwahrscheinlichkeitsplots und Histogramme zur Verfügung. Diagramme können auch aus einer Untergruppe von Variablen oder Daten erstellt werden, die einem vorher definierten Filter entsprechen. Die Diagramme werden in Standarddateiformaten wie Postscript oder PNG gespeichert und sind daher auch in anderen Anwendungen nutzbar. PSPP unterstützt verschiedene Möglichkeiten zur Verarbeitung von Daten, darunter auch mathematische Funktionen, Zufallszahlenverteilungen, Trigonometrie und Datum-Zeit-Konvertierungen. Transformationen können auch kaskadiert werden.

(ID:46962400)

Über den Autor

 Thomas Joos

Thomas Joos

Freiberuflicher Autor und Journalist