Datenmanagement Talend setzt auf Services für mehr Datenqualität

Autor / Redakteur: lic.rer.publ. Ariane Rüdiger / Nico Litzel

Der Datenmanagementspezialist Talend erweitert sein Angebotsspektrum: Mit neuen Services will das Unternehmen seinen Kunden die Verarbeitung von Daten für ihre Geschäftszwecke teilweise abnehmen und weit gehend automatisieren.

Firmen zum Thema

Jan Wetzke, Regional VP Sales Central & Eastern Europe bei Talend
Jan Wetzke, Regional VP Sales Central & Eastern Europe bei Talend
(Bild: Talend)

Talend gehört mit seinen Datenmanagement-Lösungen zu den beständigsten und erfolgreichsten Teilnehmern am Wettbewerb um den BigData-Insider Readers' Choice Award. Darauf ist Jan Wetzke, als Vice President für den regionalen Vertrieb in Zentral- und Osteuropa zuständig, stolz. „Wir sind erheblich weiter als der Großteil unseres Konkurrenzumfelds“, sagt der Manager selbstbewusst.

Beim Datenmanagement verfolgt der Anbieter einen integrierten Ansatz. Er leistet alle vier Stufen der Datenvorbereitung – von der Datensammlung über das Cleaning und die Speicherung der Datenbestände an der gewünschten Stelle bis zum Aufbau eines Datenkatalogs. Beispielsweise werden rund 150 parametrisierbare Mechanismen zur Säuberung von Datenbeständen mitgeliefert. Workflows können auch bestimmen, dass ein bestimmter Datensatz auf jeden Fall von einem Menschen durchgewinkt werden muss.

Bildergalerie

Auf dem Weg zu gesünderen Daten

Die Vision des Unternehmens ist es, zu einer optimalen „Data Health“ beizutragen. Darunter versteht Talend, dass die Datenbestände und durchgeführten Analysen tatsächlich die Geschäftsziele eines Unternehmens unterstützen.

Dazu müssen sie nach Meinung von Talend nicht nur das richtige Qualitätsniveau besitzen, die erforderlichen Compliance-Regeln einhalten, im richtigen Maß aktuell sein, ein passendes Format haben und zum Kontext passen, respektive mit passendem Kontext geliefert werden. Vor allem aber müssen sie vertrauenswürdig für interne und externe Nutzer sein. Weitere Innovationsthemen sind Selbstbedienung, ein einfach bedienbarer Datenkatalog, intelligente Datenservices und die einfache gemeinsame Nutzung des Firmen-Datenpools für unterschiedliche Zwecke.

Service für mehr Daten-Exzellenz

Beim Aufbau von Vertrauen in die präsentierten Daten soll die im Herbst 2021 verkündete Serviceinitiative „Scale Data Excellence“ helfen. Sie versteht sich als Ergänzung zur von Talend seit 2015 angebotenen Talend Data Fabric, einer Suite für die Datenaufbereitung.

Qualifizierte Talend-Mitarbeiter erstellen für ihre Kunden und deren wichtigste Daten-Assets im Rahmen des „Talend Data Quality Service“ Datenpipelines, entwickeln Regeln, unterbreiten auf Best Practices basierende Handhabungsvorschläge und pflegen dauerhaft die Daten. Außerdem erstellen sie kundenspezifische Dashboards.

„Das ist für die Kunden kostengünstiger, als alles selbst zu machen, sie sparen Personal, werden schneller fertig und können sich auf ihre eigentlich wichtigen Aufgaben konzentrieren statt auf Datenaufbereitung.“ Über konkrete Preise spricht Talend nicht, denn diese seien zu individuell.

Übers Preismodell des Jahresabos schon: Es bezieht sich auf Pakete zu jeweils fünf Daten-Assets. Dabei ist ein Asset die Datenspeicherungsstruktur, also etwa die Struktur der Kunden- oder Produktdatenbank, nicht aber der einzelne Datensatz zu verstehen. Wächst die Datenbank oder wird sie häufiger genutzt, hat das auf den Preis des Services keine Auswirkungen. „Kunden geben in der Regel zwischen fünf und 20 Assets in Auftrag“, sagt Wetzke.

Strategische Beratung von externen Partnern

Zur Vorverarbeitung mit der Data Fabric gehört auch ein Crawler, der in allen Winkeln des Unternehmens Datenbestände aufspürt. Wer allerdings lange überlegen muss, was sich gegebenenfalls mit den Datenbergen überhaupt sinnvollerweise anfangen lässt, ist unter Umständen mit den strategischen Architekturdienstleistungen gut bedient, die über Talend bezogen werden können.

„Hier arbeiten wir mit großen Partnern wie Accenture, Bearing Point oder Cognizant zusammen“, sagt Wetzke. Daneben gebe es kleinere, auf bestimmte Branchen oder Aufgaben spezialisierte Partner wie etwa Prodato.

Trust Score wird jetzt direkt in Snowflake berechnet

Zum höheren Vertrauen in Daten soll auch der bereits im Herbst 2020 angekündigte und seit dem ersten Quartal 2021 verfügbare Trust Score beitragen. Dabei wird jedes verfügbare Daten-Werkzeug im Datenkatalog (also zum Beispiel eine bestimmte Tabelle) nach verschiedenen Kriterien in eine Rangfolge eingeordnet: Sind die Daten valide, komplett, auffindbar, werden sie bereits genutzt und wie werden sie gegebenenfalls von den Anwendern bewertet? Die Angaben zu den einzelnen Bereichen verdichtet die Talend-Software zu einem Scoring. „Wenn man hört, dass bestimmte Daten schon zigmal verwendet wurden und dass alle Anwender zufrieden waren, dann hebt das das Zutrauen in diese Daten“, sagt Wetzke.

Neu ist, dass diese Berechnungen des Scores ab sofort nicht mehr in der Talend-Software stattfinden, sondern auch in Snowflake durchgeführt werden können, wenn Kunden ihre Daten dort lagern. „Viele Kunden wollen Datenbewegungen möglichst vermeiden. Denen kommen wir damit entgegen“, erklärt Wetzke.

Daten-APIs für die Selbstbedienung

Auch die Fähigkeiten für die Selbstbedienung baut Talend aus: Neu sind Daten-APIs, die die gemeinsame Verwendung von Daten durch unterschiedliche Unternehmensbereiche erleichtern sollen. „Jeder Fachanwender kann mit dieser Technik mit nur drei Klicks ein vollwertiges REStful-API erzeugen, etwa in Salesforce“, sagt Wetzke.

Und auch in einem weiteren Punkt wird Talend kundenfreundlicher: Das Daten-Ingest-Tool „Stitch“ erhält ein neues Preisschema. Stitch Unlimited wird unabhängig von der Zahl der Anwender, den Datenmengen oder anderen Parametern abgerechnet. Die gesamte Lösung wird pro Zeiteinheit abonniert und kann vom Kunden dann preisunabhängig so verwendet werden, wie er das möchte. Talend ist auch über die Hyperscaler AWS oder Azure erhältlich.

Mehr als 300 deutsche Talend-Kunden

Talend bietet seit etwa 2005 Open-Source-Lösungen für die Datenaufbereitung an und dehnt sein Tätigkeitsgebiet inzwischen auch auf andere Gebiete des Datenmanagements aus. Mit der Analytik selbst beschäftigt sich der Anbieter aber bislang nicht.

Die Firma mit heute rund weltweit 1.500 Mitarbeitern sieht sich im Wettbewerb mit den Großen der Datenmanagement-Branche wie Informatica oder IBM. „Für Unternehmen sind wir eine leistungsfähige, aber kostengünstige Alternative“, sagt Wetzke. Neuere Wettbewerber sind Firmen wie Matillion oder Fivetran, die aber laut Wetzke nur einen kleinen Teil der Funktionen von Talend-Lösungen anböten.

Der jährlich wiederkehrende Umsatz von Talend stieg im ersten Halbjahr 2021 auf 308 Millionen US-Dollar, vor einem Jahr waren es 277 Millionen US-Dollar. Das ist im Jahresvergleich rund 17 Prozent mehr und ein Wachstum von 32 Prozent bei neuen Kundenbuchungen. Wichtige Kooperationspartner sind Snowflake (laut Wetzke „derzeit die aufregendste Datenplattform“) sowie diverse Hyperscaler.

In Deutschland gibt es rund 300 Kunden. Einer davon ist Bavaria Film. Dort hat man laut Wetzke mithilfe von Talend komplexe, datenbasierte Abläufe wie die Abrechnung der Komparsen von einer tagelangen, mühseligen Handarbeit auf wenige Stunden eingedampft. „Das spart Arbeit, sodass die dafür verwendete Ressourcen jetzt sinnvoller anderswo eingesetzt werden können“, sagt Wetzke.

(ID:47804947)