Für Apache-Spark-basierte Clouds

Informatica aktualisiert Big-Data-Plattform

| Autor / Redakteur: Martin Hensel / Nico Litzel

Informatica hat die nächste Generation seiner Lösung für Big Data Management für Apache Spark-basierte Big Data Clouds vorgestellt.
Informatica hat die nächste Generation seiner Lösung für Big Data Management für Apache Spark-basierte Big Data Clouds vorgestellt. (Bild: Timur Saglambilek / pexels.com)

In der nächsten Generation von Informaticas Big-Data-Management-Plattform für Spark-basierte Big Data Clouds sorgt unter anderem Künstliche Intelligenz (KI) für belastbare Informationen und beschleunigte Analysen.

Laut Informatica soll die aktualisierte Plattform die bislang umfassendste Big-Data-Management-Lösung für Spark-basierte Big Data Clouds darstellen. Sie ermöglicht die Verwaltung großer Datenbestände sowie Big Data Streaming für AWS, Azure und die Google Cloud Platform. Zu den Kernfunktionen zählen Self-Service Data Discovery sowie Datenkatalogisierung und Datenaufbereitung für alle Nutzer.

Zudem sorgt die serverlose Big-Data-Integration mit automatischem Scaling und Tuning für optimale Ergebnisse, reduzierte Kosten und höhere Effizienz. Die neuen Funktionen basieren auf Informaticas CLAIRE-Engine, die auf Machine Learning und andere KI-Verfahren setzt.

Neuheiten im Überblick

Zu den Neuerungen zählt eine erhöhte Data-Engineering-Produktivität, die durch breitere Unterstützung von Big Data Clouds wie Google Cloud Dataproc sowie fortschrittliche serverlose Spark-Integrationen in Qubole und Azure Databricks erreicht wird. Anwender sollen zusätzlich aus der schnellen Entwicklung für IoT-Datenpipelines einen Vorteil ziehen: Dabei sorgt Machine Learning für die effiziente Verarbeitung von semi-strukturierten Daten. Für Datenwissenschaftler hält die aktualisierte Plattform neben Self-Service Data Discovery und Preparation auch mehr als 50 neue Funktionen bereit. Dazu zählen etwa statistische Funktionen, Fuzzy Clustering, Matching Rules und kontrollierter Datenzugriff dank Data Masking. Zudem wurde der Umgang mit Daten durch verschiedene Maßnahmen optimiert. Sie umfassen beispielsweise verbessertes Monitoring der Dateninfrastruktur mit Verwaltung auf Machine-Learning-Basis sowie proaktive Maßnahmen und Empfehlungen.

„Big Data Management durchläuft eine Welle von Innovationen, die es Data Operations Teams ermöglicht, effizient und effektiv mit großen Unternehmensdatenmengen für wichtige Analyseprojekte zusammenzuarbeiten und zu interagieren“, erklärt Ronen Schwartz, Senior Vice President und General Manager für Cloud, Big Data und Data Integration von Informatica. „Unsere Innovationen ermöglichen allen Ebenen an Datennutzern mit riesigen Datenmengen zu interagieren, um Erkenntnisse zu gewinnen. Zum Beispiel können Dateningenieure jetzt serverlose Datenpipelines über Apache Spark in der Cloud erstellen und damit Datenwissenschaftler mit fortschrittlicher, KI- und Machine-Learning-getriebener Self-Service-Datenvorbereitung unterstützen“, ergänzt er.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45503320 / Analytics)