Suchen

Für Apache-Spark-basierte Clouds Informatica aktualisiert Big-Data-Plattform

| Autor / Redakteur: Martin Hensel / Nico Litzel

In der nächsten Generation von Informaticas Big-Data-Management-Plattform für Spark-basierte Big Data Clouds sorgt unter anderem Künstliche Intelligenz (KI) für belastbare Informationen und beschleunigte Analysen.

Firmen zum Thema

Informatica hat die nächste Generation seiner Lösung für Big Data Management für Apache Spark-basierte Big Data Clouds vorgestellt.
Informatica hat die nächste Generation seiner Lösung für Big Data Management für Apache Spark-basierte Big Data Clouds vorgestellt.
(Bild: Timur Saglambilek / pexels.com)

Laut Informatica soll die aktualisierte Plattform die bislang umfassendste Big-Data-Management-Lösung für Spark-basierte Big Data Clouds darstellen. Sie ermöglicht die Verwaltung großer Datenbestände sowie Big Data Streaming für AWS, Azure und die Google Cloud Platform. Zu den Kernfunktionen zählen Self-Service Data Discovery sowie Datenkatalogisierung und Datenaufbereitung für alle Nutzer.

Zudem sorgt die serverlose Big-Data-Integration mit automatischem Scaling und Tuning für optimale Ergebnisse, reduzierte Kosten und höhere Effizienz. Die neuen Funktionen basieren auf Informaticas CLAIRE-Engine, die auf Machine Learning und andere KI-Verfahren setzt.

Neuheiten im Überblick

Zu den Neuerungen zählt eine erhöhte Data-Engineering-Produktivität, die durch breitere Unterstützung von Big Data Clouds wie Google Cloud Dataproc sowie fortschrittliche serverlose Spark-Integrationen in Qubole und Azure Databricks erreicht wird. Anwender sollen zusätzlich aus der schnellen Entwicklung für IoT-Datenpipelines einen Vorteil ziehen: Dabei sorgt Machine Learning für die effiziente Verarbeitung von semi-strukturierten Daten. Für Datenwissenschaftler hält die aktualisierte Plattform neben Self-Service Data Discovery und Preparation auch mehr als 50 neue Funktionen bereit. Dazu zählen etwa statistische Funktionen, Fuzzy Clustering, Matching Rules und kontrollierter Datenzugriff dank Data Masking. Zudem wurde der Umgang mit Daten durch verschiedene Maßnahmen optimiert. Sie umfassen beispielsweise verbessertes Monitoring der Dateninfrastruktur mit Verwaltung auf Machine-Learning-Basis sowie proaktive Maßnahmen und Empfehlungen.

„Big Data Management durchläuft eine Welle von Innovationen, die es Data Operations Teams ermöglicht, effizient und effektiv mit großen Unternehmensdatenmengen für wichtige Analyseprojekte zusammenzuarbeiten und zu interagieren“, erklärt Ronen Schwartz, Senior Vice President und General Manager für Cloud, Big Data und Data Integration von Informatica. „Unsere Innovationen ermöglichen allen Ebenen an Datennutzern mit riesigen Datenmengen zu interagieren, um Erkenntnisse zu gewinnen. Zum Beispiel können Dateningenieure jetzt serverlose Datenpipelines über Apache Spark in der Cloud erstellen und damit Datenwissenschaftler mit fortschrittlicher, KI- und Machine-Learning-getriebener Self-Service-Datenvorbereitung unterstützen“, ergänzt er.

(ID:45503320)