Prädiktive Modelle einfach erstellen DataRobot – die ML-Plattform für einen schnellen KI-Einstieg

Von Thomas Joos 6 min Lesedauer

Anbieter zum Thema

DataRobot bietet eine automatisierte Machine-Learning-Plattform, die es Benutzern ermöglicht, automatisiert und relativ einfach prädiktive Modelle zu erstellen.

Die Weboberfläche von DataRobot(Bild:  T. Joos)
Die Weboberfläche von DataRobot
(Bild: T. Joos)

DataRobot bietet eine Plattform für automatisiertes maschinelles Lernen (ML), die darauf ausgelegt ist, die Entwicklung und Implementierung prädiktiver Modelle zu vereinfachen. Dadurch können Unternehmen maschinelles Lernen effizient einsetzen, ohne sich tiefgehend mit den technischen Details der Modellerstellung auseinandersetzen zu müssen. Die KI-Plattform umfasst generative und prädiktive KI und ermöglicht Unternehmen, KI-Anwendungen unter eigener Kontrolle zu skalieren.

DataRobot erleichtert den Einstieg in KI

Die Plattform bietet ein einheitliches Ökosystem für KI-Betrieb, Governance und Entwicklung, das vollständige Sichtbarkeit und Überwachung für KI-Projekte sicherstellt. Durch die Integration von Funktionen zur Datenverarbeitung, Modellerstellung und Leistungsbewertung unterstützt DataRobot Organisationen dabei, die Komplexität der Implementierung und des Managements von KI-Lösungen zu navigieren. Indem es eine zentrale Anlaufstelle für das Management aller KI-Assets bietet, vom Data Wrangling bis zur Modellüberwachung, erleichtert es den Unternehmen, ihre KI-Initiativen effektiv zu steuern.

Bildergalerie

Data Wrangling in DataRobot umfasst die Aufbereitung und Transformation von Daten für die Modellbildung. Nutzer können aus einer Vielzahl von Datenquellen Daten extrahieren, diese Daten in einem interaktiven Prozess säubern, transformieren und anreichern, um sie für maschinelles Lernen vorzubereiten. Dieser Prozess beinhaltet das Identifizieren und Korrigieren von Inkonsistenzen, das Füllen von Lücken in den Daten und das Erstellen neuer Merkmale, die für die Modellierung relevant sein könnten. DataRobot automatisiert viele dieser Schritte und ermöglicht es dem Nutzer, durch visuelle Schnittstellen und intuitives Design effizient durch den Data-Wrangling-Prozess zu navigieren.

Praktikern, die DataRobot in ihren Arbeitsalltag integrieren möchten, bietet die Plattform Möglichkeiten, die über die grundlegende Modellerstellung und -bereitstellung hinausgehen. Zu diesen gehören unter anderem die Integration und Anwendung von KI-Apps ohne Programmierkenntnisse, die Nutzung fortgeschrittener Datenverarbeitungsfunktionen für präzisere Modelle und die Implementierung von Automatisierungsprozessen zur Effizienzsteigerung. Diese Funktionen ermöglichen es, komplexe Datenanalysen durchzuführen, präzise Vorhersagemodelle zu entwickeln und KI-getriebene Lösungen effektiv in bestehende Systeme zu integrieren.

Automatisierte Modellerstellung vereinfacht KI-Implementierung

DataRobot automatisiert die Auswahl, das Training und die Optimierung von Machine-Learning-Modellen. Nutzer laden ihre Daten hoch und die Plattform bewertet verschiedene Modelle, um das optimale herauszufinden. Diese Prozessautomatisierung verkürzt die Zeit bis zur Einsatzbereitschaft der Modelle erheblich. Die Plattform zeichnet sich durch eine intuitive Benutzeroberfläche aus, die es auch Anwendern ohne spezifische Vorkenntnisse ermöglicht, Machine-Learning-Modelle zu erstellen und einzusetzen.

DataRobot beschleunigt den gesamten Prozess der Modellentwicklung, von der Datenaufbereitung bis zur Implementierung, durch die Automatisierung wiederkehrender Aufgaben. Durch die Reduzierung der Komplexität macht DataRobot fortschrittliche Machine-Learning-Technologien einem breiteren Nutzerkreis zugänglich. Dadurch können auch KMU eigene KI-Modelle erstellen, zum Beispiel zur Analyse der eigenen Daten und ohne Einbeziehung externer Modelle, welche die eigenen Unternehmensdaten dann teilweise zum Training nutzen.

Regression, Klassifizierung und Zeitreihenanalysen mit DataRobot

DataRobot unterstützt eine Vielzahl von maschinellen Lernmodellen, darunter Regression, Klassifizierung und Zeitreihenanalysen. Die Plattform bietet darüber hinaus Tools zur Bewertung der Modellleistung und zur Überwachung der Modellgesundheit im Produktionsumfeld. Eine einheitliche Konsole ermöglicht die Beobachtung aller Modelle an einem Ort, unabhängig von ihrer Herkunft, bevor sie in Produktion gehen. Das umfasst generative und prädiktive Modelle. Die Integration von GenAI Guard Models und einem Feedback-Loop von Nutzern hilft dabei, Modelle kontinuierlich zu verbessern und Sicherheitsmaßnahmen wie Datenintegrität großflächig zu gewährleisten.

Für die Governance bietet DataRobot eine zentralisierte Verwaltung aller KI-Modelle, generative sowie prädiktive, unabhängig davon, ob sie auf der Plattform erstellt wurden oder nicht. Ein einheitliches Modellregister erleichtert das Testen und Evaluieren von Modellen. GenAI Cost Insights Metrics bieten Echtzeit-Einblicke in die Kosten auf Einsatz-Ebene, mit anpassbaren Metriken für kosteneffiziente Entscheidungen.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

DataRobot erleichtert auch die schnelle Entwicklung neuer GenAI-Anwendungsfälle mit einer Schnittstelle, die es ermöglicht, mit den zugrundeliegenden Komponenten zu experimentieren. Ein Multi-Provider LLM Playground bietet eine visuelle Vergleichsschnittstelle für externe LLM-Dienste, darunter Google PaLM, Azure OpenAI und AWS BedRock. Zusätzliche Funktionen wie die Integration von Unternehmens-Messaging-Apps, Notebook-Planung und anpassbare Umgebungen unterstützen einen effizienten Workflow und fördern die breite Akzeptanz generativer KI-Lösungen.

Zusammenarbeit mit Nvidia

DataRobot hat eine signifikante Weiterentwicklung seiner unternehmensfertigen KI-Lösungen durch eine Partnerschaft mit Nvidia bekanntgegeben. Diese Zusammenarbeit zielt darauf ab, die KI-Lösungen von DataRobot mit der Technologie von Nvidia zu verbessern, um bessere Performance, Sicherheit und Effizienz über den gesamten KI-Lebenszyklus hinweg zu erreichen. Zu den Schlüsselaspekten der Partnerschaft gehört die Bereitstellung von vollständig konfigurierten generativen KI-Modellen mit Nvidia-NIM-Mikroservices, die Teil von Nvidia AI Enterprise sind und die Implementierung Generativer KI über die Cloud, Datenzentren und Workstations hinweg beschleunigen sollen

Zusätzlich hat DataRobot das Generative AI Catalyst Program eingeführt, das Organisationen dabei unterstützen soll, Generative KI schneller in die Produktion zu bringen. Dieses Programm adressiert die Lücke an Fähigkeiten im Bereich der Generativen KI mit einem Angebot, das den Start und die Beschleunigung der Auslieferung von generativen KI-Anwendungsfällen ermöglichen soll. Das Programm umfasst unter anderem maßgeschneiderte Roadmaps für bedeutende Anwendungsfälle, beschleunigte Auslieferung Generativer-KI- und RAG-Lösungen, Unterstützung bei der Implementierung und Überwachung nach Maß sowie fortgeschrittene technische Schulungen.

Einstieg in DataRobot erleichtern: Beispielprojekt nutzen

Um den Umgang mit DataRobot am Beispiel eines Projektes für die Identifizierung von Patienten mit Wiedereinweisungsrisiko zu veranschaulichen, wird der Fokus auf die Vorschau und Untersuchung der Struktur und Werte des Datensatzes zur Krankenhauswiedereinweisung gelegt. Anschließend folgt das Daten-Wrangling, bei dem eine Stichprobe der Daten gezogen und Transformationen durchgeführt werden, um die Daten für das Modell vorzubereiten. Dies umfasst das Hinzufügen von Operationen zu einem Wrangling-„Rezept“, welches jede Transformation in der Live-Stichprobe aktualisiert, um sicherzustellen, dass die Trainings- und Bewertungsdatensätze konsistent sind.

Ein weiterer Schritt ist die Erstellung eines neuen Merkmals (Feature), das die vorhandenen Datensatzmerkmale nutzt, um ein neues Merkmal zu berechnen, welches das Geschäftsproblem möglicherweise besser darstellt. Beispielsweise könnte das Alter, das in einem Bereich angegeben ist, in eine einzelne Ganzzahl konvertiert werden. Sobald die Daten vorbereitet sind, erfolgt die Veröffentlichung des Wrangling-„Rezepts“, um einen neuen, transformierten Datensatz zu erstellen, der im Data Registry registriert und dem Use Case hinzugefügt wird. Der neu transformierte Datensatz wird dann untersucht, um die finalen Merkmale einschließlich der neuen, wrangled Merkmale zu überprüfen.

Der nächste Schritt umfasst die Erstellung eines Experiments, bei dem die Zielvariable, zum Beispiel die Wiedereinweisung festgelegt und das Modell entsprechend konfiguriert wird. Nach der Festlegung der Zielvariable und optionaler Einstellungen startet der Modellierungsprozess, bei dem verschiedene Modelle erstellt und bewertet werden, um das genaueste Modell für den Einsatz auszuwählen.

KI-Modelle und -Anwendungen selbst programmieren: Python, R und Go

DataRobot MLOps unterstützt aktuelle Programmiersprachen wie Python, R, Java, Scala, Go und weitere. Modelle können in der bevorzugten Sprache erstellt und dann mit DataRobot MLOps hochgeladen und bereitgestellt werden. DataRobot bietet ein vielseitiges Konzept, das auch eine massiv parallele Modeling-Engine und ein Open-Source-R-Paket umfasst. Das R-Paket ermöglicht es Benutzern, aus einer interaktiven R-Sitzung heraus eine Verbindung zur Modeling-Engine von DataRobot herzustellen, neue Modellierungsprojekte zu erstellen, Ergebnisse abzurufen und Vorhersagen zu generieren. Die Verbindung zur Modeling-Engine kann über HTTP-Anfragen erfolgen, wobei der Zugriff über einen Token und eine spezifische Endpoint-URL realisiert werden kann.

Die Open-Source-Modellinfrastruktur basiert auf dem Prinzip des Teilens von Code, Ideen und Innovationen, was ein schnelleres Wachstum des Wissensstandes einer ganzen Branche ermöglicht, als es bei proprietärem Wissen der Fall wäre. Diese Infrastruktur umfasst nicht nur Software, sondern erstreckt sich auch auf Hardware, Robotik, Fertigung und Dienstleistungen. Im Bereich des maschinellen Lernens und der Künstlichen Intelligenz unterstützen umfangreiche Open-Source-Communitys die Entwicklung mit populären Frameworks wie Python scikit-learn und R Machine-Learning-Paketen. DataRobot nutzt diese offene Infrastruktur, indem es auf Open-Source-Algorithmen für die meisten seiner Modelle setzt, die zu den besten verfügbaren gehören und aus einer Vielzahl von Open-Source-Software-Frameworks stammen.

Artikelfiles und Artikellinks

(ID:50083394)