Große Datenmengen – wirtschaftlich verarbeitet Teradata ermöglicht Deep-Dive-Analysen kompletter Datenbestände

Redakteur: Jürgen Sprenzinger

Teradata liefert ab sofort die „Teradata Extreme Data Plattform 1700“ mit erhöhter Verarbeitungsgeschwindigkeit und sehr hoher Speicherkapazität aus. Sie bietet zudem eine SQL-Engine für die Analyse von Big Data.

Firmen zum Thema

Erhöhte Verarbeitungsgeschwindigkeit und hohe Speicherkapazität: Teradata Extreme Data Plattform 1700
Erhöhte Verarbeitungsgeschwindigkeit und hohe Speicherkapazität: Teradata Extreme Data Plattform 1700
(Bild: Teradata)

Die aufkommenden und gespeicherten Datenmengen haben in allen Branchen explosionsartig zugenommen – von Hunderten von Terabytes auf Hunderte von Petabytes. Große Mengen an relationalen Daten werden üblicherweise ausgelagert, manchmal sogar gelöscht.

Für ihre Analysen brauchen Unternehmen jedoch einen schnellen und bequemen Zugang zu allen historischen Daten und nicht nur zu aktuell selektierten Daten. Eine Reihe von nicht ausgereiften SQL-Engines verspricht, diese Anforderung zu erfüllen. Leider bieten sie oft weder die Performance noch die Sicherheit oder den Funktionsumfang, den die Unternehmen benötigen.

Hermann Wimmer, Vorstand International von Teradata, sagt: „Vor Einführung der Teradata Extreme Data Plattform 1700 konnten Kunden, die eine Lösung für weniger als 5.000 Dollar pro Terabyte suchen, nur auf File-Systeme oder andere Lösungen mit eingeschränkter Funktionalität zurückgreifen, Unsere neue Plattform unterbietet diese Preisbarriere deutlich, gleichzeitig liefert sie eine SQL-Engine für die Analyse großer Mengen an relationalen Daten.“

Ein Terabyte Daten in 20 Sekunden sortiert

Ein Teradata Kunde hat „Terasort“, einen beliebten Benchmark-Test, sowohl mit der Teradata Extreme Data Plattform als auch mit einem Hadoop-Cluster durchgeführt. Bei diesem Test wird ein Terabyte Daten so schnell wie möglich sortiert. Die Teradata Extreme Data Plattform schaffte das in weniger als 20 Sekunden, während das Hadoop-Cluster 60 Sekunden benötigte, obwohl es achtmal so viele Server umfasste.

Dieser einfache Benchmark-Test soll den Leistungsvorteil der Teradata Plattform beim Sortieren von Daten belegen. Dabei profitieren die Kunden nicht nur von der hohen Leistung, sondern auch von den ausgereiften Datenbank-Funktionen, die für komplexe Datenanalysen erforderlich sind: Analytics, Sicherheit, Optimierung, Indizierung und Workload-Management.

Wie dieses Beispiel zeigt, sollten bei der Beurteilung verschiedener Lösungen immer die Gesamtbetriebskosten betrachtet werden, nicht nur die Kosten für die Beschaffung der Server.

Mehr Daten auf weniger Raum

Neben der extrem hohen Leistung bei einfachen und komplexen Analyse-Aufgaben haben Unternehmen auch die Möglichkeit, mehr Daten auf weniger Raum zu speichern. Im Produktiveinsatz benötigt die Teradata Extreme Data Plattform für die Speicherung derselben Datenmenge 15 mal weniger Platz als ein herkömmlicher Server. Die Plattform ist auf mehr als 500 Petabytes komprimierter Daten skalierbar.

Die Plattform ist mit gängigen Analytics- und Business-Intelligence-Anwendungen kompatibel und für hohe Performance ausgelegt. Sie unterstützt den Nutzer bei seinen Big-Data-Analysen und kann problemlos mit der „Teradata Database“ kombiniert werden. Die Plattform bietet Intelligent Memory, integriertes Workload-Management und Sicherheit. Sie hält die Vorgaben von ACID (Atomicity, Consistency, Isolation, Durability) ebenso ein wie den ANSI SQL-Standard des American National Standards Institute.

Was wurde verbessert?

Die Extreme-Plattform bietet Festplatten mit einer Kapazität von drei Terabytes, wodurch die Speicherung kostengünstiger wird. Die Systemverfügbarkeit wurde durch optionale Hot-Standby-Server-Knoten und Hot-Spare-Laufwerke erweitert, und die Daten sind durch eine optimierte Datenspeicher-Architektur noch besser geschützt.

Die Plattform ist mit „Dual Intel Xeon Sandybridge Eight-Core“-Prozessoren mit einer Taktfrequenz von 2,6 Gigahertz ausgestattet. Wie alle Teradata Plattformen nutzt sie das Betriebssystem „Suse Linux Enterprise Server 11“.

Deep-Dive-Analysen, zum Beispiel für Flugzeuge

Mit der zunehmenden Menge an Informationen wächst auch der Bedarf an Deep-Dive-Analysen. Teradata unterstützt Unternehmen der Luftfahrtindustrie, die maschinengenerierte Daten speichern und auswerten müssen, um für Wartung und Reparaturen gerüstet zu sein. Dabei werden sehr hohe Datenmengen verarbeitet, denn:

  • Ein Düsenflugzeug generiert in 30 Minuten Flug bis zu 10 Terabyte Informationen pro Triebwerk.
  • in zweistrahliges Flugzeug generiert auf einem Flug von New York nach Los Angeles bis zu 240 Terabytes Daten. Bedenkt man, dass zu jedem beliebigen Zeitpunkt 30.000 Flüge in der Luft sind, wird deutlich, dass die Datenmenge, die gespeichert und analysiert werden muss, sich rasant vergrößert.

Weitere Beispiele für Aufgaben, die die Speicher- und Analysefunktionen der Teradata Extreme Data Plattform benötigen:

  • Web Analytics – Analyse von integrierten Click-Stream-Daten zur gezielten Absatzförderung
  • Gesetzliche Vorgaben und Compliance – Speicherung detaillierter historischer Daten über mehrere Jahre, um die rechtlichen Aufbewahrungsfristen und andere Vorschriften einzuhalten
  • Sensor-Daten – RFID-Daten zur Überwachung von Produktbewegungen
  • Kommunikationsnetze – Datenanalysen zur Einschätzung des Verbraucherverhaltens und zur Bewertung der Leistung von Netzwerken, Mobilfunkmasten und Endgeräten, Einhaltung von rechtlichen Vorgaben zur Aufbewahrung der Historiendaten
  • Versicherungsmathematische Analysen – Analyse einer Reihe von Kriterien zur Erstellung von Risikoprofilen über Versicherte

Unified Data Architecture (UDA)

Die auf der Extreme Data Plattform gespeicherten Daten haben das einheitliche Teradata-Format und -Datenschema, was den einfachen Datenaustausch mit jedem Teradata Integrated Data Warehouse ermöglicht. Damit kann die Plattform nahtlos in die Unified Data Architecture (UDA) von Teradata integriert werden.

Sie ermöglicht die Analyse aller Datentypen über verschiedene Teradata Systemen hinweg und kombiniert so die jeweiligen Stärken der Teradata Database, der Teradata Aster Database und von Apache Hadoop® in einer Architektur.

Artikelfiles und Artikellinks

(ID:42387524)