Cloudera und Fast Forward Labs

Von der Big-Data-Infrastruktur zu analytischen Dienstleistungen

| Autor / Redakteur: Ariane Rüdiger / Nico Litzel

Hilary Mason, Mitgründerin und CEO von Fast Forward Labs, übernimmt nach der Übernahme durch Cloudera die Position des Vice President Research.
Hilary Mason, Mitgründerin und CEO von Fast Forward Labs, übernimmt nach der Übernahme durch Cloudera die Position des Vice President Research. (Bild: Cloudera/Fast Forward Labs)

Cloudera, einer der führenden Anbieter für Big-Data-Infrastrukturen, steigt mit dem Erwerb des New Yorker Kleinunternehmens Fast Forward Labs in das Geschäft mit der Beratung zu datenanalytischen Fragen ein.

Im September hat die börsennotierte Cloudera das kleine Beratungshaus Fast Forward Labs erworben. Es wurde 2014 von den Datenwissenschaftlern Hilary Mason und Micha Gorelick gegründet. Derzeit hat es acht feste und etwa genauso viele freie Mitarbeiter. Die Fast Forward Labs befassen sich in etwa zu gleichen Teilen mit angewandter Datenanalyse und mit Grundlagenforschung auf dem Gebiet intelligenter Analysesoftware. Die Firma ist profitabel, über den Kaufpreis wollen beide Partner Stillschweigen bewahren. Es gab auch weitere Interessenten.

Warum aber ließ sich Masons Team überhaupt aufkaufen? „Wir konnten mit unseren finanziellen Mitteln zwar Prototypen realisieren, unsere analytischen Lösungen aber nicht in marktgängige Produkte transformieren.“ Das sei nun mithilfe des finanziell stärkeren Partners Cloudera möglich. „Clouderas Kunden haben die Daten, Cloudera hat die Infrastruktur und wir haben die analytischen Algorithmen“, sagt Mason.

Bei Cloudera soll das Fast Forward Team weiter zusammenbleiben und vom Büro in New York aus arbeiten. Es behält seine Kunden wie bisher und betreibt weiter Forschung. Mason wird bei Cloudera als Vice President Research fungieren. Der Newsletter wird in das Produktportfolio von Cloudera übernommen. Cloudera schreibt in seinem Blog, man dürfe davon ausgehen, dass der Zugang das Produkt- und Serviceportfolio des Big-Data-Spezialisten vergrößern werde.

Mason sagt von sich, sie sei seit dem Teenageralter von Mathematik und der Möglichkeit, selbst etwas entwickeln oder bauen zu können, fasziniert. „Ich finde es beispielsweise extrem spannend, dass es Computer geben wird, die unsere Gesichtsausdrücke erkennen können.“ Mason erschien unter anderem bereits auf der Liste der „Forbes 40 under 40 Ones to Watch“, einer Liste von Persönlichkeiten, die gerade dabei sind, ihren Einfluss zu vergrößern.

Forschung und Anwendung unter einem Dach

Was zeichnet den Ansatz der Fast Forward Labs aus? Zunächst ist jeder Mitarbeiter zugleich Berater und Forscher. Forschungsresultate können insofern sofort praktisch getestet und zu bisherigen Ansätzen in Relation gesetzt werden. Alle drei Monate bringt das Unternehmen einen Forschungsreport heraus, den die Kunden abonnieren. Dieser sorgt für etwa die Hälfte der Umsätze. Die andere Hälfte generiert die Beratung von Kunden. Mason: „Viele unserer Kunden beziehen gleichzeitig den Newsletter und lassen sich beraten.“

Der spezifische Forschungsprozess, den Masons Team anwendet, hat einen extrem breiten Ansatz. Besonders fokussiert er sich auf gerade neu entwickelte Methoden, beispielsweise für die Analyse natürlicher Sprache. „Unser Prozess zeigt, welche Methoden und Tools den erwünschten Einfluss auf das zu lösende Problem haben. Wir sammeln und suchen zunächst alle verfügbaren, besonders neue Ansätze und bewerten diese umfassend quantitativ und qualitativ in Bezug auf das fragliche Problem. Dabei geht es beispielsweise auch um die Finanzierbarkeit einer Methode oder eines Algorithmus.“ Es mache einen Unterschied, wenn ein Algorithmus erhebliche Mengen an Rechenpower brauche.

Wichtig sind auch die verfügbaren Werkzeuge – etwa ob sie günstig oder als Open-Source-Variante verfügbar seien. Mason bevorzugt grundsätzlich Open-Source-Tools wie die Tensorflow-Programmbibliothek für KI und Maschinenlernen im Bereich Sprachverstehen. Solche Algorithmen können in Zukunft sehr wichtig werden. Denn die Analyse natürlichsprachiger Inputs lässt sich beispielsweise dazu verwenden, automatisch und in Echtzeit festzustellen, wie gesetzgeberische Änderungen bestehende Verträge von Finanzdienstleistern beeinflussen. Eine Aufgabe, die heute Heerscharen gut dotierter Juristen beschäftigt, was Schlüsse auf die Obsoleszenz vieler Berufsgruppen zulässt, wenn KI sich voll entfaltet.

Schlüsselthema Analyse unstrukturierter Daten

Solche Themen, die den Umgang unstrukturierten Daten erfordern, sind die Spezialität von Fast Forward Labs. Die Kunden wollen beispielsweise wissen, in welche Themen sie investieren sollten, sie wollen aus längeren Videos automatisch kurze Trailer für die Online-Werbung auf YouTube erstellen lassen, sie wollen Kommentare auf ihrer Website nach unterschiedlichen Aspekten analysieren, oder sie wollen wissen, welche der hundert Geschichten, die pro Tag produziert werden, für eine spezifische Zielgruppe am besten auf die Facebook-Seite wandern, um den größtmöglichen Effekt zu erzeugen. „Unternehmen stehen heute vor der Herausforderung, ihre unstrukturierten Daten sinnvoll zu nutzen“, sagt Mason.

Namen darf Mason nicht nennen, sie rückt aber immerhin heraus, dass ein großes deutsches Verlagshaus mit Fast Forward zusammenarbeitet. Allerdings sei man nicht auf irgendwelche Branchen oder Anwendungen fokussiert, so lange es sich um analytische Algorithmen handelt.

Zu den Themen, die jüngst im Forschungs-Newsletter behandelt wurden, gehört der Einsatz von Deep-Learning-Mechanismen in Empfehlungssystemen. Kompliziert wird das besonders dann, wenn zu einem neuen Produkt, das empfohlen werden soll, noch keine Daten vorhanden sind. Hier setzt Fast Forward semantische Mechanismen ein. Ein anderes Forschungsthema besteht darin, sich damit zu befassen, warum Lernalgorithmen aus bestimmten Inputs bestimmte Outputs generieren. Das ist wichtig um zu verhindern, dass die Lernalgorithmen beispielsweise Vorurteile reproduzieren oder zu unzutreffenden Schlüssen kommen. In einem solchen Fall müssen dann die Algorithmen entsprechend angepasst werden.

Risiken der KI-Entwicklung

Generell sieht Mason durchaus Risiken in der derzeitigen Entwicklung der KI. „Ich finde, Technologien sollten von denen entwickelt werden, die sie auch nutzen.“ Das sei derzeit noch zu selten der Fall. Auch das Thema Datenethik beschäftigt sie. Deshalb arbeitet sie beispielsweise im Vorstand von Data & Society mit, einem gemeinnützigen New Yorker Institut, das sich mit den sozialen und kulturellen Auswirkungen datenzentrischer Technologieentwicklung beschäftigt. Es wurde, so die Website, maßgeblich durch eine großzügige Spende von Microsoft finanziert. Das Institut beschäftigt sich ausführlich auch mit der Ethik von intelligenten Systemen. „In jedem Report von Data & Society kommt dieses Thema vor“, beteuert Mason. An den Standardisierungsaktivitäten der IEEE, die sich mit der neuen Standardfamilie P7000 ebenfalls mit der Festlegung ethischer und Verhaltensnormen für autonome Systeme und intelligente Algorithmen beschäftigt, ist sie nicht beteiligt. „Wir denken nicht, dass die IEEE die beste Organisation für diese Themen ist“, sagt sie.

Anders als viele Europäer sieht Mason aber insgesamt eher die positiven Möglichkeiten analytischer Technologien. „Wenn man einem US-Datenverantwortlichen eine neue, kreative Methode der Datenanalyse vorstellt, ist er in der Regel begeistert. Die Europäer sind da viel zurückhaltender“, meint sie.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44964170 / Künstliche Intelligenz)