Suchen

Machine Learning und Datenanalyse beschleunigen Das kann die Intel Data Analytics Acceleration Library

Autor / Redakteur: Thomas Joos / Nico Litzel

Bei der Verarbeitung von Daten in den Bereichen Big Data und Machine Learning spielt die Leistung eine wesentliche Rolle. Intel unterstützt Entwickler hier mit der kostenlosen Data Analytics Acceleration Library (DAAL).

Firmen zum Thema

Intel DAAL hilft, Anwendungen für Intel-Prozessoren zu optimieren
Intel DAAL hilft, Anwendungen für Intel-Prozessoren zu optimieren
(Bild: Intel)

Intels Data Analytics Acceleration Library (DAAL) soll Entwickler dabei helfen, Anwendungen bereitzustellen, die eine maximale Leistung bei der Analyse bieten. Im Fokus steht dabei die bessere Ausnutzung vorhandener Hardware für die Analyse. DAAL wird vom gleichen Team entwickelt, dass auch die Intel Math Kernel Library (MKL) entwickelt.

DAAL hilft dabei, Datenverarbeitungsprozesse und mathematische Berechnungen zu optimieren. Auch Optimierungen für die Bearbeitung großer Datenmengen sind damit möglich. DAAL arbeitet in diesem Bereich auch mit Hadoop und Spark zusammen. Der hauptsächliche Grund dafür auf DAAL zu setzen, besteht in der Leistungsverbesserung von Umgebungen zur Datenanalyse.

Big Data und KI

Im Randbereich kann DAAL dabei helfen, Umgebungen so zu optimieren, dass die Analyse von Daten beim Machine Learning durchgeführt werden können, obwohl die Hardware dazu nicht in der Lage ist. Beispiele dafür ist Machine Learning in Embedded Systems. Auf der anderen Seite profitieren High-End-Umgebungen von einer noch besseren Leistung.

Neben dem Big-Data-Bereich oder der herkömmlichen Datenanalyse spielt hier auch das Thema Künstliche Intelligenz (KI) eine wichtige Rolle, denn auch hier ist die Geschwindigkeit wichtig. In Umgebungen mit KI-Anwendungen kann es daher ebenfalls sinnvoll sein, auf DAAL zu setzen, um die Anwendungen für die jeweilig aktuelle Hardware oder Cloud-Umgebung anzupassen.

Funktionen der nächsten Prozessorgeneration nutzen

Dazu kommt, dass in der jeweils aktuellen Version von DAAL Funktionen von Intel-Prozessoren bereits integriert sind. Das heißt, Entwickler können Anwendungen entwickeln, die bereits die bereits Funktionen der nächsten Prozessorgeneration nutzen. Die Vorteile liegen auf der Hand. Die Apps sind länger aktuell und können sofort die Leistung der nächsten Prozessorgeneration nutzen, wenn ein Unternehmen die Hardware aktualisiert. Der Code verfügt dann bereits über die Unterstützung dieser Technologie.

Intel Parallel Studio XE mit Intel DAAL

Intel DAAL ist auch Bestandteil von Intel Parallel Studio XE und Intel Studio. Hier stehen ebenfalls Open-Source-Versionen zur Verfügung, die kostenlos eingesetzt werden können. Dazu ist es allerdings oft notwendig, den Intel Priority Support zu buchen. Wer über diesen bereits verfügt, sollte sich die Möglichkeiten von Intel DAAL genauso ansehen, wie Intel Parallel Studio XE. Neben DAAL gehören zu Intel Studio XE noch folgende Bereiche, die gemeinsam genutzt werden können:

  • Intel C/C++ und Fortran Compiler
  • Intel Math Kernel Library
  • Intel Data Analytics Acceleration Library
  • Intel Integrated Performance Primitives
  • Intel Threading Building Blocks

Intel DAAL im Datenanalyse-Ökosystem

Intel DAAL kann alle Bereiche in der Datenanalyse-Pipeline adressieren. Dazu gehören das Pre-Processing, Transformation, Analyse, Modelling, Validation und Decision-Making. Die dazu notwendigen Szenarien können mit C++, Java oder Python umgesetzt werden. Als Datenquelle können verschiedene Systeme genutzt werden. Dazu gehören auch CSV, SQL und HDFS. Als Plattform können Windows, Linux und MacOS X genutzt werden. Für die Plattformen stehen verschiedene Konnektoren zur Verfügung.

DAAL hilft bei verschiedenen Bereichen der Datenanalyse
DAAL hilft bei verschiedenen Bereichen der Datenanalyse
(Bild: Intel)

In der aktuellen Version werden aktuelle Intel-Prozessoren unterstützt. Dazu gehören Intel Xeon Phi genauso, wie Intel-7xxx- und die Intel-Xeon-Prozessoren E5-xxxx v4. Intel Xeon Phi ist für maximale Leistung optimiert, profitiert daher von DAAL. Die Installation kann auf Linux-Rechnern auch mit YUM und Apt-Get erfolgen.

Intel DAAL und die Cloud – Google Cloud Platform

In vielen Big-Data-Umgebungen kommt die Cloud zum Einsatz. Daher ist es auch hier sinnvoll, auf DAAL zu setzen, auch wenn in den meisten Fällen genügend Hardwareressourcen zur Verfügung stehen. Beim Einsatz von DAAL kann die gebuchte Hardware besser ausgenutzt werden und in einzelnen Fällen besteht sogar die Möglichkeit, weniger Ressourcen zu buchen, was Kosten einspart.

Google bietet in der Google Cloud Platform (GCP) die Unterstützung für DAAL. Da die Ressourcen in GCP auf Intel-Prozessoren setzen, lassen sich Apps ebenfalls optimieren, wenn diese in der Cloud auf Basis von GCP ausgeführt werden. Auch im High Performance Computing setzt GCP auf Intel-Prozessoren. Die entsprechenden Apps lassen sich mit DAAL daher ideal an Intel-Prozessoren anpassen, genauso wie an GPC. Dadurch wird die maximale Leistung in der Cloud-Umgebung erreicht.

Wer auf GPC setzt kann Intel Performance Libraries in der Compute-Engine-Umgebung kostenlos einsetzen. Die Kooperation von Intel und Google ermöglicht einen effektiven Betrieb von virtuellen Anwendungen in der Cloud. Alle Möglichkeiten zeigen die beiden Unternehmen auf einer Internetseite zu diesem Thema.

Fazit

Unternehmen oder Entwickler, die große Datenmengen effektiv und schnell analysieren wollen, sollten sich die Funktionen von DAAL ansehen. Neben der Möglichkeit, auch auf kleinerer Hardware effektive Datenanalysen durchführen zu können, kann High-End-Hardware besser genutzt werden. Apps sind mit DAAL zukunftssicherer und alle Funktionen aktueller Intel-Prozessoren können in einer App genutzt werden.

(ID:45420080)

Über den Autor

 Thomas Joos

Thomas Joos

Freiberuflicher Autor und Journalist