Was ist PaddlePaddle?

Definition Was ist PaddlePaddle?

17.07.2018Autor / Redakteur: Dipl.-Ing. (FH) Stefan Luber / Nico Litzel

PaddlePaddle ist ein Open-Source-basiertes Deep Learning Framework des chinesischen Suchmaschinenanbieters Baidu. Es ermöglicht maschinelles Lernen mithilfe neuronaler Netze und unterstützt verteilte Rechnerarchitekturen mit CPUs und GPUs. Auf Basis des Frameworks lassen sich KI-Anwendungen realisieren.

PaddlePaddle steht für „PArallel Distributed Deep Learning“. Es handelt sich um ein Framework für das Deep Learning, das vom größten asiatischen Suchmaschinenanbieter Baidu entwickelt wurde. Mithilfe von PaddlePaddle und neuronalen Netzwerken lassen sich Anwendungen der Künstlichen Intelligenz (KI) realisieren. Das Framework steht in Konkurrenz mit anderen ähnlichen Lösungen wie TensorFlow oder Caffe.

PaddlePaddle unterstützt eine Vielzahl verschiedener Architekturen neuronaler Netzwerke und bietet intelligente Algorithmen zur Optimierung der Lernprozesse. Die Plattform für das Deep Learning ist skalierbar und kann auf verteilten Architekturen sowohl auf CPUs als auch auf GPUs betrieben werden. Charakteristiken des Frameworks sind die Einfachheit sowie die effiziente und sichere Arbeitsweise. Es gilt als sehr einsteigerfreundlich.

PaddlePaddle kommt seit Jahren für das Deep Learning in eigenen Produkten des Unternehmens Baidu zum Einsatz. Die Verwendung reicht von der Baidu-Suchmaschine über Online-Werbung bis zu Tools für die Systemsicherheit und Spracherkennung. In bis zu 30 eigenen Anwendungen sind laut Angaben von Baidu Funktionen von PaddlePaddle implementiert. Seit 2016 ist PaddlePaddle als frei verfügbare Open Source Software auf GitHub veröffentlicht und kann von externen Entwicklern oder Unternehmen für eigene Projekte und Anwendungen eingesetzt werden. Dokumentiert ist PaddlePaddle sowohl in englischer als auch in chinesischer Sprache.

Technische Merkmale des Deep Learning Frameworks PaddlePaddle

PaddlePaddle basiert auf einer speziellen Deep-Learning-Programmiersprache. Das Framework kann eine Vielzahl verschiedener Modelle beschreiben und diese trainieren. Um aufwendige Rechenoperationen durchzuführen und eine gute Skalierbarkeit zu erzielen, sind Funktionen für verteiltes Computing implementiert. PaddlePaddle stellt Entwicklern für einen einfachen Überblick über die Trainingsperformance und statistische Daten ein Visualisierungstool zur Verfügung. Es vereinfacht die Entwicklungsarbeit und das Debugging mit dem Deep Learning Framework. Zur Ausschöpfung der Hardwareressourcen verwendet PaddlePaddle mit systeminternen Funktionen wie SSE und AVX optimierte mathematische Operationen. In den genutzten BLAS-Bibliotheken sind die elementaren Operationen der linearen Algebra wie Matrix- oder Vektoroperationen bereitgestellt. Programmierbar ist das Deep Learning Framework per C++ oder über eine Python Library.

PaddlePaddle und verteiltes Computing

Grundsätzlich ist PaddlePaddle als schlankes, von Computer-Infrastrukturen unabhängiges Deep Learning Framework designt. Es lässt sich on top verschiedener Frameworks für verteiltes Computing wie Hadoop oder Spark betreiben. Darüber hinaus ist PaddlePaddle kompatibel mit dem Cluster-Management-System Kubernetes. Dadurch ist es möglich, komplexe Modelle auf verteilten Computing-Architekturen mit großer Leistungsfähigkeit zu trainieren. Die Zahl an Systemen, die sich für PaddlePaddle verwenden lassen, steigt durch Kompatibilität mit den verschiedenen Lösungen. Wichtige Grundfunktionen, die die verteilten Architekturen PaddlePaddle bereitstellen, sind:

redundante Strukturen mit hoher Fehlertoleranz

automatische Skalierung der Rechenleistung

flexible Zuweisung einzelner oder gebündelter Jobs an unterschiedliche Ressourcen wie Speicher, Rechenleistung oder I/O-Leistung

effiziente Ausnutzung der zur Verfügung stehenden Hardware

(ID:45401192)