Dateien und Datenbanken mit einer Abfragesprache durchforsten

R – Auf dem Weg zur Lingua Franca in der Datenanalyse

Seite: 2/3

Anbieter zum Thema

Methoden der Mustererkennung

Für diese großen Aufgabengebiete existiert eine Vielzahl von statistischen und mathematischen Methoden wie Clusteranalysen, Faktorenanalysen, Zeitreihenanalysen etc. Diese Methodengruppen in sich haben wiederum diverse unterschiedliche Verfahren. Mit Hilfe fachgerechter Kombination der verschiedenen Methoden, den richtigen Daten und einer geeigneten Software lassen sich beliebig kreative Fragestellungen lösen.

Ob Mustererkennung, Vorhersage oder Data Mining – um die Möglichkeiten von Daten effizient zu nutzen, muss das eingesetzte Analysetool jedoch zunächst in der Lage sein, die spezifischen Anforderungen abzudecken und sich in die unternehmerischen Prozesse zu integrieren. Kompatibilität zu anderer Software, Datentypen und Programmiersprachen sind für einen reibungslosen integrierten und flexiblen Analyseprozess ohne Medienbrüche unabdingbar.

Neben diesen technischen Standards sind die Qualität und das Methodenrepertoire entscheidende Kriterien für den Einsatz der Softwarelösung. Weitere Aspekte im Rahmen der Entscheidung für eine Software sind Punkte wie Investitionssicherheit, Fachkräfte oder das Kosten- und Nutzenverhältnis.

R ist leistungsstarkes Universalwerkzeug

Die Software und Programmiersprache R setzt im Bereich der statistischen Datenanalyse neue Maßstäbe. R wurde 1993 an der Universität von Auckland in Neuseeland entwickelt und steht für einen völlig neuartigen Ansatz, mit Daten aller Art umzugehen.

In der Basisversion bietet R eine Vielzahl von statistischen Methoden wie lineare und nichtlineare Modellierung, klassische statistische Testverfahren, Zeitreihenanalyse, Clusteranalysen etc. und Werkzeuge zur grafischen Visualisierung. Als GNU-Projekt, das heißt als freie Software unter offener Lizenzordnung, wird die R von einer interdisziplinären vorwiegend wissenschaftlichen Community weiterentwickelt.

Die Community hat mehr als 4.000 Pakete entwickelt, die für nahezu alle Fragen der Datenanalyse eine Lösung bieten. Die Pakete erlauben die Auswertung von Markforschungsdaten, Finanzdaten, Audio-Files, MRT-Bildern, Social-Media Daten oder Grafiken. Der deutsche R-Spezialist eoda hat unter anderem ein Paket zur interaktiven Darstellungen von Grafiken für Web-Anwendungen entwickelt.

R findet Anwendung in allen Bereichen empirischer Wissenschaft, wobei sich die verschiedenen Disziplinen gegenseitig befruchten. Verfahren der Mustererkennung, die ursprünglich in der Genforschung entwickelt wurden finden heute beispielsweise Verwendung bei Finanzdienstleistern.

Aus der Wissenschaft in die Wirtschaft

Aus historischen Gründen hat R traditionell viele Anwender im wissenschaftlichen Umfeld. In den letzten Jahren haben jedoch auch die Anwender in Unternehmen die Vorzüge der freien Sprache R entdeckt.

Finanzinstitute betreiben Risikomanagement mit R, Pharmaunternehmen entwickeln Medikamente mit Hilfe von R, Airlines analysieren die Kundenstimmung auf Twitter mit R und bei Salzgitter Mannesmann werden Prozesse in der Stahlherstellung mit R optimiert.

Mit R lassen sich sowohl ad hoc kleinere Analysen durchführen, wie auch komplette Analyse- und Reporting-Prozesse abbilden und in eine bestehende Systemlandschaft integrieren.

(ID:35227410)