Ein ML-Entwicklungssystem und: Künstliche Intelligenzen lernen voneinander KI-System und Swarm Learning mit HPE
Hewlett Packard Enterprise bringt mit „HPE Swarm Learning“ eine Software für das dezentrale KI-Training auf den Markt. Damit können verschiedene Standorte und Organisationen KI-Trainingsergebnisse teilen, ohne Rohdaten auszutauschen. Um das Training von KI-Modellen zu beschleunigen oder erst einmal zu ermöglichen, bietet HPE ein Komplettsystem an: eine Softwareplattform für Maschinelles Lernen, HPC-Systeme, Beschleuniger, Netzwerke und System-Management.
Anbieter zum Thema

Das „HPE Machine Learning Development System“ ist eine integrierte und vorkonfigurierte KI-Infrastruktur, die sofort einsetzbar ist. Als Teil des Angebots bietet „Pointnext Services“ eine Vor-Ort-Installation und ein Software-Setup. Das System ist sofort als Basismodul mit Erweiterungsoptionen verfügbar. Die kleine Konfiguration enthält:
- Das „HPE Machine Learning Development Environment“, womit Unternehmen Modelle schnell entwickeln, iterieren und skalieren können – von der Testphase bis zur Produktionsreife. Die ML-Software stammt aus der Übernahme von Determined AI und wurde inzwischen umbenannt.
- Das „HPE Apollo 6500 Gen10 Plus“- System, das Rechenkapazität zum Trainieren und Optimieren von KI-Modellen bietet und mit 8 „Tensor-Core“-GPUS von Nvidia mit 80 Gigabyte (GB) Arbeitsspeicher bestückt ist
- System-Management mit der Software „HPE Performance Cluster Management“, dem Server „Proliant DL325“ und 1Gb-Ethernet-Switches des Typs „Aruba CX 6300“.
- Hochgeschwindigkeitsübertragung mit „Nvidia Quantum Infiniband“
Das HPE-System trägt unter anderem dazu bei, die Genauigkeit der Modelle durch verteiltes Training, automatische Hyperparameter-Optimierung und Neural Architecture Search zu verbessern. Zu den Pilotanwendern des HPE Machine Learning Development System gehört das deutsche Startup Aleph Alpha.
Das Unternehmen trainiert mit dem HPE-System sein multimodales KI-Modell, das Natural Language Processing (NLP) und Computervision verbindet. Das Modell kombiniert damit Bild- und Texterkennung für fünf Sprachen mit einem menschenähnlichen Kontextverständnis. Nach der Bereitstellung des HPE Machine Learning Development System konnte Aleph Alpha in Rekordzeit mit dem Training beginnen. Zum Einsatz kommen dabei Hunderte von GPUs.
Jonas Andrulis, Gründer und CEO von Aleph Alpha, erläutert: „Das HPE Machine Learning Development System gibt uns eine erstaunliche Effizienz und eine Leistung von mehr als 150 TeraFlops. Das System wurde schnell aufgesetzt, und wir konnten mit dem Modell-Training innerhalb von Stunden anstatt erst nach Wochen beginnen.“ Er setzt hinzu: „Angesichts unserer gewaltigen Workloads und unserer laufenden Forschungstätigkeit ist es ein großer Vorteil, sich auf eine integrierte Lösung für Deployment und Monitoring verlassen zu können.“
Notwendig: Nutzerfreundlichkeit erhöhen und Komplexität senken
Laut IDC haben Unternehmen in Bezug auf KI-Infrastruktur im Schnitt einen niedrigen Reifegrad. Das sei oft der Grund für das Scheitern von KI-Projekten (siehe: Kasten). In der Regel erfordere die Einführung einer KI-Infrastruktur einen komplexen, mehrstufigen Prozess, der den Kauf, die Einrichtung und Verwaltung eines hochgradig parallelen Software-Ökosystems und einer maßgeschneiderten Infrastruktur umfasst.
Künstliche Intelligenzen lernen voneinander
Zunächst setzt Justin Hotard, Executive Vice President und General Manager, HPC & AI, HPE, für alle Unbedarften auseinander, was Swarm Learning überhaupt sein soll: „Schwarmlernen ist ein neuer, leistungsstarker KI-Ansatz, mit dem bereits Fortschritte bei der Bewältigung globaler Herausforderungen erzielt wurden – etwa bei der Verbesserung der Gesundheitsversorgung und beim Erkennen von Anomalien in der Betrugsaufdeckung und bei der vorausschauenden Wartung.“
Der Clou dabei: Die Daten, die von KI-Systemen interpretiert werden, können aus verschiedenen Quellen kommen und müssen trotzdem nicht verschoben, dupliziert oder ausgetauscht werden (siehe Video: „What is Swarm Learning?“). „HPE trägt auf bedeutende Weise zur Verbreitung des Schwarmlernens bei, indem es eine für größere Organisationen geeignete Lösung bereitstellt, mit der diese zusammenarbeiten, Innovationen voranbringen und die Leistung ihrer KI-Modelle steigern können – während sie zugleich ihre ethischen, datenschutzrechtlichen und regulatorischen Standards einhalten“, so Hotard.
HPE Swarm Learning löst Probleme des zentralisierten KI-Trainings
Das Problem bisher: KI-Modell-Training findet üblicherweise an einem zentralen Standort mit zentralisierten Datensätzen statt. Dieser Ansatz kann jedoch ineffizient und kostspielig sein, wenn große Datenmengen an einen Ort geschickt werden müssen. Oft verhindern zudem Datenschutz oder Bedenken hinsichtlich der Datensouveränität eine Zentralisierung der Daten. Die Folge kann sein, dass zu wenige Daten für das KI-Training zur Verfügung stehen.
HPE Swarm Learning versetzt Organisationen in die Lage, verteilte Datenquellen für das KI-Training zu nutzen, ohne dass die Quelldaten transferiert werden. Stattdessen teilen sie KI-Trainingsergebnisse in Form von Modellparametern.
Dieses Verfahren wird über eine Blockchain organisiert. Sie steuert beispielsweise die Aufnahme von Schwarm-Mitgliedern und die wiederkehrende Wahl eines Mitglieds, das im jeweiligen Trainingszyklus die Modellparameter zusammenführt. Das gibt dem Schwarmnetzwerk Stabilität und Sicherheit. Zudem können große Datenmengen für das KI-Training erschlossen werden, ohne den Datenschutz oder die Datensouveränität zu beeinträchtigen.
Zu den möglichen Einsatzgebieten von HPE Swarm Learning gehören beispielsweise die folgenden:
- Krankenhäuser können KI-Trainingsergebnisse etwa aus CT- und MRT-Scans oder aus Genexpressionsdaten mit anderen Krankenhäusern teilen, um die Diagnose von Krankheiten zu verbessern und gleichzeitig die Patientendaten zu schützen.
- Banken und Finanzdienstleister können Kreditkartenbetrug bekämpfen, indem sie betrugsrelevante Modellparameter mit mit anderen Finanzinstituten austauschen.
- Fertigungsstandorte können mit Schwarmlernen ihre vorausschauende Wartung verbessern, indem sie Trainingsergebnisse aus Sensordaten aus mehreren Produktionsstandorten sammeln.
Erfolge in der Krebsforschung und in der Betrugserkennung
Zu den ersten Anwendern von HPE Swarm Learning gehört ein Team von Krebsforschern am Universitätsklinikum der RWTH Aachen. Dieses hat eine Studie durchgeführt, um die Diagnose von Darmkrebs zu verbessern, indem es KI auf die Bildverarbeitung anwendet. Damit will man genetische Veränderungen vorhersagen, die dazu führen können, dass Zellen krebsartig werden.
Die Forscher haben KI-Modelle mithilfe von HPE Swarm Learning mit Patientendaten aus Irland, Deutschland und den USA trainiert und die Vorhersageleistung mit zwei unabhängigen Datensätzen aus Großbritannien verglichen. Die Ergebnisse haben gezeigt, dass Schwarmlernen die KI-Modelle übertroffen hat, die nur auf lokalen Daten trainiert wurden.
Tigergraph, ein auf Betrugserkennung spezialisierter Anbieter von Graph-Analyse-Lösungen, kombiniert HPE Swarm Learning mit seinen eigenen Analysewerkzeugen, um ungewöhnliche Vorgänge bei Kreditkartentransaktionen möglichst schnell zu erkennen. Die Kombination erhöht die Genauigkeit beim Trainieren von ML-Modellen aus riesigen Mengen von Finanzdaten, die von mehreren Banken und Filialen an verschiedenen Standorten stammen.
Artikelfiles und Artikellinks
(ID:48265041)