Suchen

Data-Science-Plattform aktualisiert Dataiku steht in Version 7 bereit

Autor / Redakteur: Martin Hensel / Nico Litzel

Mit der neuen Version 7 erhält die Data-Science-Plattform Dataiku erweiterte Funktionen für Statistiker und Datenwissenschaftler. Zudem sind individuelle Erklärungen für Vorhersagen neu an Bord.

Firmen zum Thema

Die aktuelle Version 7 von Dataiku bringt einige Neuerungen.
Die aktuelle Version 7 von Dataiku bringt einige Neuerungen.
(Bild: Dataiku)

Die Dataiku-Plattform bringt in Version 7 zahlreiche neue Funktionen mit, die eine unternehmensweite datenbasierte Zusammenarbeit auf allen Ebenen vereinfachen soll. Zu den Neuerungen zählt der Support von Advanced Statistical Analysis. Dadurch können Statistiker weitreichende statistische Analysen im „Worksheet-and-Card“ durchführen und gleichzeitig mit einem größeren Daten- oder Analytics-Team zusammenarbeiten. Zuvor waren Einzellösungen nötig, die besonders in Hinblick auf Governance und KI-Entwicklung einen Flaschenhals darstellten.

Mehr Hintergrundinformationen

Normalerweise geben Machine-Learning-Modelle keine Erklärung, wie oder warum sie eine bestimmte Vorhersage getroffen haben. In Dataiku 7 ist das nun anders: Die Plattform liefert Erklärungen zu Vorhersagen und verdeutlichen, welche Charakteristiken oder Funktionen den größten Einfluss auf die Ergebnisse des Modells hatten. Dies ist sowohl auf Zeilenebene als auch mittels interaktiver Darstellungen möglich.

Dataiku 7 bietet zudem eine umfassende Git-Integration. Data Scientists und Programmierer können dadurch Git-Zweige direkt in der Plattform erstellen, löschen sowie Pushs und Pulls ausführen. Somit lassen sich Projekte effizienter bearbeiten, da Duplikate einfach erstellt und in einer Sandbox erprobt werden können. Sobald die Weiterentwicklung abgeschlossen ist, werden die Änderungen in das ursprüngliche Projekt integriert und in Git dokumentiert.

Kubernetes und Kennzeichnungen

Version 7 erweitert die Fähigkeit, Kubernetes-Cluster in Dataiku zu verwalten. Anwender können nun auch Web-Applikationen auf den Clustern nutzen. Dies erhöht die gleichzeitige Anzahl an Usern und stellt ein schnelles, flexibles Backend zur Ausführung ressourcenintensiver KI-Deployments bereit.

Dataiku hat zudem die Möglichkeit ergänzt, Daten zu kennzeichnen. Sauber gekennzeichnete Daten sind Voraussetzung, um präzise und hochwertige Erkenntnisse aus Machine-Learning-Modellen zu gewinnen. Sie beschleunigen zusätzlich den kompletten Analyse-Lebenszyklus, indem sie die zeitraubende Datensammlung vereinfachen. Eine neue „Human-in-the-loop“-Kennzeichnung und ein Plug-in zum aktiven Lernen liefern eine Reihe von Dataiku-Webapplikationen. Sie sollen den Kennzeichnungsprozess vereinfachen, ganz gleich, ob es sich um Dateninhalte aus Tabellen, Bildern oder sogar Tönen handelt.

Weitere Informationen zu Dataiku gibt es im Rahmen eines Webinars am 16. April. Eine Anmeldemöglichkeit ist auf der Website der Data-Science-Plattform zu finden.

(ID:46493354)