Suchen

Definition Was ist KNIME?

| Autor / Redakteur: Dipl.-Ing. (FH) Stefan Luber / Nico Litzel

KNIME ist eine freie Software für die interaktive Analyse großer Datenmengen. Sie lässt sich für das Data Mining einsetzen und verfügt über eine grafische Benutzeroberfläche. Datenanalyseaufgaben werden als Workflows aus einzelnen nacheinander auszuführenden modularen Schritten zusammengesetzt. Für KNIME existieren zahlreiche kommerzielle Erweiterungen und Anwendungen.

Firma zum Thema

(Bild: © aga7ta - stock.adobe.com)

KNIME ist die Abkürzung für „Konstanz Information Miner“. Es handelt sich um eine freie Software für das Data Mining und die interaktive Analyse großer Datenmengen. Entwickelt wurde die Software an der Universität Konstanz. 2006 wurde die erste Version von KNIME veröffentlicht. Zwei Jahre später, 2008, entstand in Zürich die KNIME.com GmbH. Sie bietet professionellen Support für KNIME sowie kommerzielle Erweiterungen und Anwendungen für die Analysesoftware.

KNIME verfügt über eine grafische Benutzeroberfläche, mit der sich Datenanalyseaufgaben in Form von Workflows aus einzelnen Modulen zusammensetzen lassen. Die Software beherrscht die Datenvorverarbeitung, die Modellierung, die Analyse der Daten und die Visualisierung der Ergebnisse. Typische Einsatzbereiche sind Big-Data-Analysen beispielsweise in der pharmazeutischen Forschung, im Customer Relationship Management (CRM), im Finanzwesen und in der Business Intelligence (KI). Geschrieben ist KNIME in Java. Die KNIME Analytics Platform nutzt Funktionalitäten des quelloffenen Programmierwerkzeugs Eclipse. Mithilfe von Plug-ins und Konnektoren lässt sich KNIME umfangreich erweitern, beispielsweise für das Image Mining, für komplexe Zeitreihenanalysen und für die Kompatibilität mit zahlreichen Dateiformaten und Datenbanksystemen. Auch Machine-Learning-Algorithmen lassen sich integrieren.

KNIME steht für Betriebssysteme wie Windows, MacOS und Linux zur Verfügung und lässt sich auch als Service aus der Cloud beziehen. Anbieter wie Amazon oder Microsoft bieten auf ihren Cloud-Plattformen entsprechende Lösungen. Die Software steht unter freier GPL-Lizenz. Die Version 4.0 ist 2019 erschienen.

Designziele von KNIME

In der Entwicklung von KNIME wurden die folgenden drei Designziele verfolgt:

  • 1. Bereitstellung einer grafischen, interaktiven Benutzeroberfläche für die Drag-&-drop-Bedienung
  • 2. Modularer Aufbau der Datenverarbeitungs- und -analysevorgänge
  • 3. Einfache Erweiterbarkeit und Unterstützung der unterschiedlichsten Daten- und Datenbanktypen

Merkmale von KNIME

KNIME gestattet die Integration von Modulen per Plug-ins. In der Core-Version ist bereits eine Vielzahl an Modulen für unterschiedliche Aufgaben enthalten. Die Module sind für Datenbankoperationen, Datenein- und -ausgaben, Datentransformationen, Datenanalysen und Datenvisualisierungen einsetzbar. Die Menge an Daten, die sich mit KNIME verarbeiten lässt, ist nur vom verfügbaren Festplattenplatz begrenzt. Über Plug-ins werden auch Text Mining, Image Mining und Zeitreihenanalysen mit der Software möglich.

Die Benutzeroberfläche und das Konzept von KNIME

KNIME arbeitet mit visuellen Workflows. Datenanalyseaufgaben werden in viele verschiedene Einzelschritte zerlegt. Die einzelnen Schritte stellt die Benutzeroberfläche mithilfe grafischer Elemente dar. Der Anwender kann die einzelnen Elemente per Drag-&-drop auswählen, zusammenstellen und verketten. Die Programmierung eines Codes ist für die Datenanalysen und das Data Mining nicht notwendig.

Die einzelnen Elemente eines Workflows repräsentieren Knoten mit Ein- und Ausgängen, die zu einem Graphen verbunden sind. Ein Knoten stellt einen bestimmten Algorithmus dar. Er gibt beispielsweise Knoten für Einleseaufgaben, Transformationsaufgaben, Analyseaufgaben, Visualisierungsaufgaben und Ausgabeaufgaben. Einleseknoten sind für das Einlesen der Daten und ihre Integration in den Workflow zuständig. Daten werden in der Form von Tabellen mit Kopfzeile und ID-Spalte dargestellt. Transformationskonten verwandeln die eingelesenen Daten in die benötigten oder gewünschten Formate. Sie übernehmen auch die Aufgaben der Gruppierung und Filterung der Daten. Die eigentliche Auswertung der Daten findet in den Analyseknoten statt.

Den Abschluss eines Workflows bilden die Visualisierungsknoten und Ausgabeknoten. Mit diesen ist es möglich, Diagramme und andere Visualisierungen oder bestimmte Dateien wie CSV-Dateien zu generieren. Die Verbindungen zwischen den Knoten werden auch als Kanten oder Assoziationen bezeichnet. Ein Workflow kann aus beliebig vielen Knoten und Kanten bestehen.

Vorteile von KNIME

Die Datenanalyse und das Data Mining mit der KNIME Analytics Platform bietet zahlreiche Vorteile. Im Folgenden ein kurzer stichpunktartiger Überblick über die wichtigsten Vorteile:

  • Die Software ist frei verfügbar und steht unter GPL-Lizenz,
  • es existiert eine große Community im Internet, die kostenlosen Support leistet,
  • es stehen zusätzlich professioneller Support und kommerzielle Erweiterungen oder Anwendungen für KNIME zur Verfügung,
  • KNIME unterstützt die gängigen Betriebssysteme wie Windows, Linux und MacOS und ist auch als Service aus der Cloud verfügbar,
  • es können großen Datenmengen analysiert werden,
  • KNIME bietet eine grafische, leicht bedienbare Benutzeroberfläche, mit der sich die Workflows ohne Programmierkenntnisse per Drag-&-drop aus einzelnen Elementen zusammensetzen lassen,
  • mit KNIME können die Analyseergebnisse anschaulich visualisiert werden,
  • KNIME beherrscht Machine Learning und
  • über Plug-ins lässt sich die Funktionalität einfach erweitern.

(ID:46586805)

Über den Autor