Suchen

Machine Learning IBM SystemML wird Open Source

| Autor / Redakteur: Dipl. -Ing. Thomas Drilling / Nico Litzel

IBM hat das Framework für maschinelles Lernen „SystemML“ dem Apache-Spark-Projekt übergeben, sodass dieses unter Obhut der Apache Software Foundation (ASF) weiterentwickelt wird. Big Blue folgt damit dem Trend, dass Machine Learning Software zunehmend an Bedeutung gewinnt und von vielen Entwicklern quelloffen geschrieben und veröffentlicht wird.

Firmen zum Thema

IBM öffnet sein Machine-Learning-Projekt
IBM öffnet sein Machine-Learning-Projekt
(Bild: IBM, The Apache Software Foundation)

Maschinelles Lernen (ML) ist derzeit eines der Trendthemen in der Informationstechnologie. Unter maschinellem Lernen versteht man Softwaresysteme, die ohne menschliches Zutun von selbst ihre Fähigkeiten erweitern.

Entsprechende ML-Systeme können zum Beispiel Muster erkennen sowie Dokumente kategorisieren und bekannten Entitäten zuordnen. ML-Systeme sind unter anderem für Suchmaschinen von großer Bedeutung, die mithilfe von ML die Bedürfnisse der Anwender verstehen lernen, um damit noch individueller passender Ergebnisse liefern zu können.

Die Konkurrenz schläft nicht

Google hat beispielsweise erst vor Kurzem mit dem RankBrain-Algorithmus für Aufmerksamkeit gesorgt. Angeblich will Google mit seiner Hilfe bereits seit rund fünf Monaten unbekannte Suchanfragen mit seiner ML-Umsetzung interpretieren und zuordnen können.

Sein eigenes ML-Framework TensorFlow hatte Google ebenfalls erst vor Kurzem vorgestellt. Dieses lässt sich nach Angaben von Google beispielsweise zur Spracherkennung einsetzen.

IBM SystemML

IBMs Machine Learning Framework hört auf dem Namen SystemML und besteht aus zwei Teilen: Mit der Programmiersprache Declarative Machine Learning (DML) können Programmierer verschiedene Funktionen und Konstrukte für das Erstellen von ML-Algorithmen schreiben. DML verfügt über eine R-, bzw. Python-ähnliche Syntax.

Zu SystemML gehört aber auch ein automatisches Optimieren auf Basis der Eigenschaften der zugrunde liegenden Daten. Das sorgt für mehr Effizienz und dient zudem einer besseren Skalierbarkeit. Technisch setzt SystemML eine MapReduce-Umgebung wie Hadoop voraus, funktioniert aber auch hervorragend mit Apache Spark.

Wie üblich muss Apache SystemML zunächst im Inkubator der Apache Software Foundation reifen. Weitere Informationen zu den technischen Details sowie eine Dokumentation finden sich auf den Developer-Seiten von IBM sowie auf Github.

(ID:43759512)

Über den Autor

Dipl. -Ing. Thomas Drilling

Dipl. -Ing. Thomas Drilling

IT-Consultant, Trainer, Freier Journalist