Definition

Was ist Big Data?

| Autor / Redakteur: Michael Radtke / Nico Litzel

(© aga7ta - Fotolia)

Der im Internet und in den Unternehmen verfügbare Datenberg – diese Tatsache wird als Big Data umschrieben – wird immer größer, unübersichtlicher und lässt sich nur schwer verarbeiten. Immer technologisch anspruchsvollere Tools und Programme sollen die Datenflut zähmen.

Der Begriff Big Data stammt aus dem englischen Sprachraum. Erst als Phänomen oder als Hype wahrgenommen, fassen die Experten mittlerweile unter diesem Begriff zwei Aspekte zusammen. Demnach umschreibt er zum einen die immer rasanter wachsenden Datenmengen; zum anderen aber geht es auch um neue und explizit leistungsstarke IT-Lösungen und Systeme, mit denen Unternehmen die Informationsflut vorteilhaft verarbeiten können. Insbesondere unstrukturierte Daten – zum Beispiel aus den sozialen Netzwerken – machen dabei einen nicht unerheblichen Teil der Massendaten aus. Mit dem Grid Computing steht diesbezüglich jetzt eine spezielle Form des verteilten Rechnens zur Verfügung, womit eine rechen- und datenintensive Datenverarbeitung ermöglicht wird.

Eine neue Ära digitaler Kommunikation

In Deutschland wird die Wortschöpfung Big Data oft als Sammelbegriff für die moderne digitale Technologie verwendet. Aber nicht nur die digitalen Datenmengen an sich stehen im Fokus. Vielmehr nimmt Big Data und die damit einhergehende Digitalisierung auch nachhaltig Einfluss auf die Sammlung, Nutzung, Verwertung, Vermarktung und vor allem Analyse der digitalen Daten. Inzwischen steht dieser Name diesbezüglich für eine vollkommen neue Ära digitaler Kommunikation und entsprechender Verarbeitungspraktiken. In sozialer Hinsicht wird dieser Umstand sogar für einen grundlegenden gesellschaftlichen Wandel – respektive Umbruch – verantwortlich gemacht.

Wettbewerbsvorteile mit Big Data Analytics generieren

Diese Entwicklung hat aber gerade Auswirkungen auf die Unternehmenslandschaft. Die Firmen erhalten nämlich durch die großen Mengen an Daten, die zur Verfügung stehen, ganz neue Einblicke in die Interessen, das Kaufverhalten und auch das Risikopotenzial von Kunden sowie von potenziellen

Interessenten. Damit die Information auch entsprechend gefiltert, untersucht, beurteilt und entsprechend eingeordnet werden können, greifen Unternehmen gezielt zu Analytics-Methoden. Hinter dem Begriff Analytics verbergen sich dabei explizite Maßnahmen, um in dem Datenbergen unbekannte Korrelationen, versteckte Muster und andere nützliche Informationen zu identifizieren. Diese Erkenntnisse können dann für Wettbewerbsvorteile gegenüber Konkurrenten sorgen oder auch anderweitige geschäftliche Vorteile – wie etwa ein effektiveres Marketing oder auch Umsatzsteigerungen – bringen.

Software Tools für eine fortschrittliche Analytik

Die Unternehmen verfolgen mit der komplexen Datenanalyse dabei in erster Linie das Ziel, bessere Entscheidungsgrundlagen für die eigene Geschäftstätigkeit zu schaffen. Um dieses Hauptziel zu realisieren, wertet ein Data Scientist – die Experten für Big Data – die riesigen Mengen an entsprechenden Transaktionsdaten sowie zusätzlich an anderweitigen Informationen aus den unterschiedlichsten Datenquellen aus.

Zu diesen Quellen zählen zum Beispiel Internet-Clickstreams, Protokolle von Webservern, Einzelverbindungsnachweise für Mobiltelefone, Informationen von Sensoren oder vor allem auch Berichte über Social-Media-Aktivitäten der User. Für die Verarbeitung und Analyse dieser Massendaten greifen Unternehmen auf Software Tools zurück, die sowohl Big als auch Small Data Analytics umfassend ermöglichen.

Quelloffene Software Frameworks

In den vergangenen Jahren ist eine ganz neue Klasse von extrem leistungsstarken Technologien und Programmen entstanden. Dabei rücken gerade quelloffene Software Frameworks wie Apache Hadoop, Spark, NoSQL-Datenbanken sowie zum Beispiel Map Reduce in den Fokus. Gerade Spark und vor allem Hadoop erfreuen sich dabei einer ungemein großen Beliebtheit. Hadoop basiert auf dem von Google generierten MapReduce-Algorithmus in Kombination mit Vorschlägen des Google-Dateisystems. Anwender können mit diesem Programm große Datenmengen im Rahmen intensiver Rechenprozesse auf so bezeichneten Computerclustern verarbeiten; dieser Vorgang wird auch als Cluster Computing bezeichnet. Die Entwicklung in diesem Bereich wird stetig durch Software-Unternehmen vorangetrieben, etwa von den Anbietern Cloudera oder Hortonworks.

Big Table, Graphdatenbanken und Distributed File Systems

Immer mehr an Bedeutung gewinnt dabei zum Beispiel Big Table, das von Google entwickelte Hochleistungs-Datenbanksystem. Auch das einfach strukturierte, verteilte Datenbankverwaltungssystem Cassandra rückt als explizite Lösung für sehr große strukturierte Datenbanken verstärkt in den Vordergrund. Dabei ist Cassandra insbesondere auf Ausfallsicherheit und eine hohe Skalierbarkeit ausgelegt.

Eine weitere Lösungsalternative stellen zum Beispiel Graphdatenbanken dar. Hierbei werden stark vernetzte Informationen als Graphen dargestellt, wobei die spezialisierten Graphalgorithmen komplexe bzw. komplizierte Datenbankanfragen erheblich vereinfachen. Zudem ist es ratsam, ein verteiltes Dateisystem – ein Distributed File System – zu nutzen. Ein solches Netzwerk-Dateisystem optimiert die Zugriffs- und Speicherungsmöglichkeiten deutlich.

Optimierte Speichertechnik

Neben moderner und hoch funktioneller Software spielt auch die Hardware – explizit die Speichertechnologie – bei Big Data eine entscheidende Rolle. Mittlerweile macht es die Speichertechnologie möglich, Datenvolumen im Rahmen des sogenannten In-Memory Computing direkt im Hauptspeicher eines Rechners zu halten. Früher mussten diese Daten gewöhnlich auf langsamere Speichermedien wie Festplatten oder Datenbanken ausgelagert werden. Dank In-Memory Computing wird jetzt die Rechengeschwindigkeit deutlich erhöht und die Echtzeitanalyse umfangreicher Datenbestände ermöglicht.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Aktuelle Beiträge zu diesem Thema

Auf diese Technologien setzen Unternehmen

Big Data und Bots

Auf diese Technologien setzen Unternehmen

Big Data wird in zahlreichen Unternehmen bereits umgesetzt. Trendthema ist insbesondere die robotergesteuerte Prozessautomatisierung (RBA). lesen

Data Scientists – heiß begehrt auf dem Arbeitsmarkt!

Kommentar von Carsten Nagel, Weidmüller Gruppe

Data Scientists – heiß begehrt auf dem Arbeitsmarkt!

Die Gründe, warum eine strategische Datenanalyse bis heute noch nicht wirklich effektiv ist, sind vielfältig. Zu der Praxisferne mancher Entwickler gesellen sich häufig falsche Inhalte, fehlende didaktische Ansätze und mangelnde Vorbereitungen für den passenden Nachwuchs. Dabei entscheiden Wissen und Kompetenz über den Erfolg eines Unternehmens. Wo also muss nachjustiert werden? lesen

Braucht das Marketing neue Methoden durch die DSGVO?

Nachbericht b.telligent BI-Kongress 2018

Braucht das Marketing neue Methoden durch die DSGVO?

Rund 400 Gäste kamen nach München zum BI-Kongress 2018 der auf dieses Thema spezialisierten Beratungsfirma b.telligent. Im Mittelpunkt der Tagung standen die Anwendung von Big Data, Data Science, Cloud-Technologien und IoT sowie die demnächst gültige DSGVO (Datenschutz-Grundverordnung) der EU. lesen

Intel Big Data Analytics Platforms im Überblick

Aufeinander abgestimmte Hard- und Software

Intel Big Data Analytics Platforms im Überblick

Geht es um Big-Data-Analysen, müssen Unternehmen auf leistungsstarke Hardware setzen, die optimal mit der Analyse-Software zusammenarbeitet. Hier gibt es verschiedene Anbieter, mit denen Intel kooperiert. lesen

Fehlende Fachkräfte bremsen KI-Zug

IDC-Studie

Fehlende Fachkräfte bremsen KI-Zug

IT-Entscheider sind bereit, Künstliche Intelligenz in ihrem Unternehmen einzusetzen und sammeln dafür Big Data. Die erste Anlaufstelle für das Thema sind Systemintegratoren und Systemhäuser. Der Fachkräftemangel bremst allerdings die Umsetzung der Projekte. lesen

Teradata befindet die Public Cloud reif für Analytics

Nachbericht Teradata Universe London 2018

Teradata befindet die Public Cloud reif für Analytics

Das Thema der diesjährigen „Teradata Universe“ lautete: Analytics in der Cloud. Wie bitte? Cloud ist doch längst ein „Nobrainer“, wie es im Business-Deutsch heißt. Aber nicht im Analytics-Umfeld, kontert Oliver Ratzesberger, Chief Operations Officer (COO) der Teradata Corp., San Diego. Eine durchgängige Analytics-Umgebung, die on premise und mit derselben Lizenz auch in diversen Cloud-Umgebungen laufe, die mit fremden Tools integrierbar und vor allem skalierbar sei – das habe es bislang nicht gegeben. lesen

Datenökonomie: Möglichkeiten noch nicht ausgeschöpft

Big Data

Datenökonomie: Möglichkeiten noch nicht ausgeschöpft

Rund 196 Milliarden Euro im Jahr beträgt die datengetriebene Wertschöpfung (Data Economy, Datenökonomie) in Deutschland. Aber nur 55 Prozent des vollen Potenzials werden tatsächlich ausgeschöpft. Generell wächst die Data Economy schneller als die deutsche Wirtschaft insgesamt. lesen

Data Analytics – fünf Tipps für den Start im Mittelstand

Kommentar von Dr. Uwe Heckert, Unisys

Data Analytics – fünf Tipps für den Start im Mittelstand

Viele Großkonzerne sind beim Thema Data Analytics bereits gut aufgestellt, doch der Mittelstand hat noch Aufholbedarf. Dr. Uwe Heckert, Vice President Public Sector EMEA und Geschäftsführer Unisys Deutschland, gibt fünf Tipps, wie Big-Data-Projekte auch in mittelständischen Unternehmen gelingen können. lesen

So deckt Predictive Analytics Risiken auf

Kommentar von Rudolf Scheller, FM Global

So deckt Predictive Analytics Risiken auf

Big Data Analytics gehört auch in der Versicherungsbranche zu den heiß diskutierten Themen. Laut einer aktuellen Befragung des IT-Unternehmens Infosys wollen 65 Prozent der Befragungsteilnehmer aus dem Versicherungsbereich in Big-Data-Lösungen investieren, um mit der technischen Entwicklung Schritt zu halten. Fakt ist jedoch auch, dass sich die Anwendungsfälle innerhalb der Branche stark unterscheiden. lesen

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44399329 / Definitionen)