DataRobot bietet eine automatisierte Machine-Learning-Plattform, die es Benutzern ermöglicht, automatisiert und relativ einfach prädiktive Modelle zu erstellen.
Die Weboberfläche von DataRobot
(Bild: T. Joos)
DataRobot bietet eine Plattform für automatisiertes maschinelles Lernen (ML), die darauf ausgelegt ist, die Entwicklung und Implementierung prädiktiver Modelle zu vereinfachen. Dadurch können Unternehmen maschinelles Lernen effizient einsetzen, ohne sich tiefgehend mit den technischen Details der Modellerstellung auseinandersetzen zu müssen. Die KI-Plattform umfasst generative und prädiktive KI und ermöglicht Unternehmen, KI-Anwendungen unter eigener Kontrolle zu skalieren.
DataRobot erleichtert den Einstieg in KI
Die Plattform bietet ein einheitliches Ökosystem für KI-Betrieb, Governance und Entwicklung, das vollständige Sichtbarkeit und Überwachung für KI-Projekte sicherstellt. Durch die Integration von Funktionen zur Datenverarbeitung, Modellerstellung und Leistungsbewertung unterstützt DataRobot Organisationen dabei, die Komplexität der Implementierung und des Managements von KI-Lösungen zu navigieren. Indem es eine zentrale Anlaufstelle für das Management aller KI-Assets bietet, vom Data Wrangling bis zur Modellüberwachung, erleichtert es den Unternehmen, ihre KI-Initiativen effektiv zu steuern.
Bildergalerie
Data Wrangling in DataRobot umfasst die Aufbereitung und Transformation von Daten für die Modellbildung. Nutzer können aus einer Vielzahl von Datenquellen Daten extrahieren, diese Daten in einem interaktiven Prozess säubern, transformieren und anreichern, um sie für maschinelles Lernen vorzubereiten. Dieser Prozess beinhaltet das Identifizieren und Korrigieren von Inkonsistenzen, das Füllen von Lücken in den Daten und das Erstellen neuer Merkmale, die für die Modellierung relevant sein könnten. DataRobot automatisiert viele dieser Schritte und ermöglicht es dem Nutzer, durch visuelle Schnittstellen und intuitives Design effizient durch den Data-Wrangling-Prozess zu navigieren.
Praktikern, die DataRobot in ihren Arbeitsalltag integrieren möchten, bietet die Plattform Möglichkeiten, die über die grundlegende Modellerstellung und -bereitstellung hinausgehen. Zu diesen gehören unter anderem die Integration und Anwendung von KI-Apps ohne Programmierkenntnisse, die Nutzung fortgeschrittener Datenverarbeitungsfunktionen für präzisere Modelle und die Implementierung von Automatisierungsprozessen zur Effizienzsteigerung. Diese Funktionen ermöglichen es, komplexe Datenanalysen durchzuführen, präzise Vorhersagemodelle zu entwickeln und KI-getriebene Lösungen effektiv in bestehende Systeme zu integrieren.
DataRobot automatisiert die Auswahl, das Training und die Optimierung von Machine-Learning-Modellen. Nutzer laden ihre Daten hoch und die Plattform bewertet verschiedene Modelle, um das optimale herauszufinden. Diese Prozessautomatisierung verkürzt die Zeit bis zur Einsatzbereitschaft der Modelle erheblich. Die Plattform zeichnet sich durch eine intuitive Benutzeroberfläche aus, die es auch Anwendern ohne spezifische Vorkenntnisse ermöglicht, Machine-Learning-Modelle zu erstellen und einzusetzen.
DataRobot beschleunigt den gesamten Prozess der Modellentwicklung, von der Datenaufbereitung bis zur Implementierung, durch die Automatisierung wiederkehrender Aufgaben. Durch die Reduzierung der Komplexität macht DataRobot fortschrittliche Machine-Learning-Technologien einem breiteren Nutzerkreis zugänglich. Dadurch können auch KMU eigene KI-Modelle erstellen, zum Beispiel zur Analyse der eigenen Daten und ohne Einbeziehung externer Modelle, welche die eigenen Unternehmensdaten dann teilweise zum Training nutzen.
Regression, Klassifizierung und Zeitreihenanalysen mit DataRobot
DataRobot unterstützt eine Vielzahl von maschinellen Lernmodellen, darunter Regression, Klassifizierung und Zeitreihenanalysen. Die Plattform bietet darüber hinaus Tools zur Bewertung der Modellleistung und zur Überwachung der Modellgesundheit im Produktionsumfeld. Eine einheitliche Konsole ermöglicht die Beobachtung aller Modelle an einem Ort, unabhängig von ihrer Herkunft, bevor sie in Produktion gehen. Das umfasst generative und prädiktive Modelle. Die Integration von GenAI Guard Models und einem Feedback-Loop von Nutzern hilft dabei, Modelle kontinuierlich zu verbessern und Sicherheitsmaßnahmen wie Datenintegrität großflächig zu gewährleisten.
Für die Governance bietet DataRobot eine zentralisierte Verwaltung aller KI-Modelle, generative sowie prädiktive, unabhängig davon, ob sie auf der Plattform erstellt wurden oder nicht. Ein einheitliches Modellregister erleichtert das Testen und Evaluieren von Modellen. GenAI Cost Insights Metrics bieten Echtzeit-Einblicke in die Kosten auf Einsatz-Ebene, mit anpassbaren Metriken für kosteneffiziente Entscheidungen.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
DataRobot erleichtert auch die schnelle Entwicklung neuer GenAI-Anwendungsfälle mit einer Schnittstelle, die es ermöglicht, mit den zugrundeliegenden Komponenten zu experimentieren. Ein Multi-Provider LLM Playground bietet eine visuelle Vergleichsschnittstelle für externe LLM-Dienste, darunter Google PaLM, Azure OpenAI und AWS BedRock. Zusätzliche Funktionen wie die Integration von Unternehmens-Messaging-Apps, Notebook-Planung und anpassbare Umgebungen unterstützen einen effizienten Workflow und fördern die breite Akzeptanz generativer KI-Lösungen.
Zusammenarbeit mit Nvidia
DataRobot hat eine signifikante Weiterentwicklung seiner unternehmensfertigen KI-Lösungen durch eine Partnerschaft mit Nvidia bekanntgegeben. Diese Zusammenarbeit zielt darauf ab, die KI-Lösungen von DataRobot mit der Technologie von Nvidia zu verbessern, um bessere Performance, Sicherheit und Effizienz über den gesamten KI-Lebenszyklus hinweg zu erreichen. Zu den Schlüsselaspekten der Partnerschaft gehört die Bereitstellung von vollständig konfigurierten generativen KI-Modellen mit Nvidia-NIM-Mikroservices, die Teil von Nvidia AI Enterprise sind und die Implementierung Generativer KI über die Cloud, Datenzentren und Workstations hinweg beschleunigen sollen
Zusätzlich hat DataRobot das Generative AI Catalyst Program eingeführt, das Organisationen dabei unterstützen soll, Generative KI schneller in die Produktion zu bringen. Dieses Programm adressiert die Lücke an Fähigkeiten im Bereich der Generativen KI mit einem Angebot, das den Start und die Beschleunigung der Auslieferung von generativen KI-Anwendungsfällen ermöglichen soll. Das Programm umfasst unter anderem maßgeschneiderte Roadmaps für bedeutende Anwendungsfälle, beschleunigte Auslieferung Generativer-KI- und RAG-Lösungen, Unterstützung bei der Implementierung und Überwachung nach Maß sowie fortgeschrittene technische Schulungen.
Einstieg in DataRobot erleichtern: Beispielprojekt nutzen
Um den Umgang mit DataRobot am Beispiel eines Projektes für die Identifizierung von Patienten mit Wiedereinweisungsrisiko zu veranschaulichen, wird der Fokus auf die Vorschau und Untersuchung der Struktur und Werte des Datensatzes zur Krankenhauswiedereinweisung gelegt. Anschließend folgt das Daten-Wrangling, bei dem eine Stichprobe der Daten gezogen und Transformationen durchgeführt werden, um die Daten für das Modell vorzubereiten. Dies umfasst das Hinzufügen von Operationen zu einem Wrangling-„Rezept“, welches jede Transformation in der Live-Stichprobe aktualisiert, um sicherzustellen, dass die Trainings- und Bewertungsdatensätze konsistent sind.
Ein weiterer Schritt ist die Erstellung eines neuen Merkmals (Feature), das die vorhandenen Datensatzmerkmale nutzt, um ein neues Merkmal zu berechnen, welches das Geschäftsproblem möglicherweise besser darstellt. Beispielsweise könnte das Alter, das in einem Bereich angegeben ist, in eine einzelne Ganzzahl konvertiert werden. Sobald die Daten vorbereitet sind, erfolgt die Veröffentlichung des Wrangling-„Rezepts“, um einen neuen, transformierten Datensatz zu erstellen, der im Data Registry registriert und dem Use Case hinzugefügt wird. Der neu transformierte Datensatz wird dann untersucht, um die finalen Merkmale einschließlich der neuen, wrangled Merkmale zu überprüfen.
Der nächste Schritt umfasst die Erstellung eines Experiments, bei dem die Zielvariable, zum Beispiel die Wiedereinweisung festgelegt und das Modell entsprechend konfiguriert wird. Nach der Festlegung der Zielvariable und optionaler Einstellungen startet der Modellierungsprozess, bei dem verschiedene Modelle erstellt und bewertet werden, um das genaueste Modell für den Einsatz auszuwählen.
KI-Modelle und -Anwendungen selbst programmieren: Python, R und Go
DataRobot MLOps unterstützt aktuelle Programmiersprachen wie Python, R, Java, Scala, Go und weitere. Modelle können in der bevorzugten Sprache erstellt und dann mit DataRobot MLOps hochgeladen und bereitgestellt werden. DataRobot bietet ein vielseitiges Konzept, das auch eine massiv parallele Modeling-Engine und ein Open-Source-R-Paket umfasst. Das R-Paket ermöglicht es Benutzern, aus einer interaktiven R-Sitzung heraus eine Verbindung zur Modeling-Engine von DataRobot herzustellen, neue Modellierungsprojekte zu erstellen, Ergebnisse abzurufen und Vorhersagen zu generieren. Die Verbindung zur Modeling-Engine kann über HTTP-Anfragen erfolgen, wobei der Zugriff über einen Token und eine spezifische Endpoint-URL realisiert werden kann.
Die Open-Source-Modellinfrastruktur basiert auf dem Prinzip des Teilens von Code, Ideen und Innovationen, was ein schnelleres Wachstum des Wissensstandes einer ganzen Branche ermöglicht, als es bei proprietärem Wissen der Fall wäre. Diese Infrastruktur umfasst nicht nur Software, sondern erstreckt sich auch auf Hardware, Robotik, Fertigung und Dienstleistungen. Im Bereich des maschinellen Lernens und der Künstlichen Intelligenz unterstützen umfangreiche Open-Source-Communitys die Entwicklung mit populären Frameworks wie Python scikit-learn und R Machine-Learning-Paketen. DataRobot nutzt diese offene Infrastruktur, indem es auf Open-Source-Algorithmen für die meisten seiner Modelle setzt, die zu den besten verfügbaren gehören und aus einer Vielzahl von Open-Source-Software-Frameworks stammen.