Tipps zu Big Data und Datensicherheit

10 Dinge, die Sie über Sicherheit in Big-Data-Umgebungen wissen sollten

| Autor / Redakteur: Thomas Joos / Nico Litzel

Bei der Positionierung von Big Data in der Cloud müssen Administratoren für Sicherheit beim Datenzugriff sorgen.
Bei der Positionierung von Big Data in der Cloud müssen Administratoren für Sicherheit beim Datenzugriff sorgen. (Bild: T. Joos)

Geht es um die Verarbeitung riesiger Datenmengen im Big-Data-Umfeld, dürfen Unternehmen die Sicherheit der Daten nicht außen vor lassen. Hier spielen der Datenschutz und die Absicherung der eigenen Unternehmensdaten eine wichtige Rolle. Wir zeigen, was zu beachten ist, und welche Tools dabei helfen.

1. Bereits bei der Planung die Sicherheit berücksichtigen

Unternehmen sollten bereits bei der Planung von Big-Data-Projekten genau planen, welche Mitarbeiter und Gruppen Rechte auf die verschiedenen Daten erhalten sollen. Auch das Festlegen der Prozesse zur Datenübermittlung an die Big-Data-Lösung – inklusive eventueller Sicherheitslücken – muss berücksichtigt werden.

Verantwortliche Mitarbeiter für den Schutz der einzelnen Daten sollten benannt, instruiert und mit Mitteln versorgt werden, um die Sicherheit zu gewährleisten. Das können Tools für die Berichterstellung und zur Überwachung von Datenübertragungen sein, aber auch Teilnahme an Projektgruppen, welche die Sicherheit der Daten betreffen. Auch die IT-Sicherheit und Vorbeugung vor Manipulation der Daten muss frühzeitig geplant und in die Infrastruktur eingebunden werden. Grundsätzlich muss genau festgelegt werden, welcher Personenkreis Zugriff auf die einzelnen Daten und Auswertungen haben soll.

2. Datenverarbeitung juristisch klären lassen

Die Verarbeitung vieler Daten kann juristische Folgen haben, vor allem, wenn es um Ermittlungen in sozialen Netzwerken oder um Umfragen geht. Unternehmen sollten nach der Planung der Prozesse auf jeden Fall Juristen die Verarbeitung der Daten bewerten lassen und sicherstellen, dass erforderliche Sicherheitsmaßnahmen, Prozesse, Compliance-Richtlinien, aber auch alle Arten der Datenverarbeitung, juristisch einwandfrei sind. Neben der rechtlich abgesicherten Datenverarbeitung spielen hier aber auch die Datensicherheit und der Datenschutz eine Rolle.

Sobald Daten Dritter ins Spiel kommen und personifizierte Daten erhoben und gespeichert werden, sollte sehr sorgfältig vorgegangen werden, vor allem wenn die Big-Data-Lösung in der Cloud positioniert ist. Vorteil bei der Positionierung in der Cloud ist allerdings auch, dass hier oft schon Lösungen zur Sicherheit implementiert sind, die sich leicht zuschalten lassen.

3. Zweck der Datensammlung klar definieren – auch international

In der EU ist das Sammeln von Daten ohne fest definierten Zweck nicht erlaubt. Viele Big-Data-Funktionen, zum Beispiel das Verbinden von Abfragen mehrerer sozialer Netzwerke, sind in Europa schlichtweg nicht zulässig. In anderen Staaten, wie zum Beispiel den USA, gibt es hier weniger Hürden. Andere Länder sind in dieser Hinsicht jedoch ähnlich streng wie die EU. Daher müssen Verantwortliche einen Datenschutzplan für jedes Land in Erwägung ziehen, aus dem Daten verarbeitet oder in dem Berichte erstellt werden sollen.

4. Big-Data-Kompetenzzentren – Hilfe von Universitäten

Das Bundesministerium für Bildung und Forschung hat zwei Kompetenz-Zentren gegründet, welche die Verarbeitung von Daten in Big-Data-Szenarien verbessern sollen. Dabei steht nicht nur die leistungsstarke Verarbeitung im Vordergrund, sondern auch die IT-Sicherheit.

Verantwortliche im Unternehmen sollten sich die Veröffentlichung und Informationen der beiden Kompetenzzentren ansehen. Das Berliner Kompetenzzentrum für Big Data beschäftigt sich auch mit Open-Source-Anwendungen in diesem Bereich. Das zweite Zentrum ist das Competence Center for Scalable Data Services and Solutions.

5. Berechtigungen mit Erweiterungen implementieren – Apache Drill

Apache Drill erweitert Hadoop-Umgebungen und NoSQL-Datenbanken um die Möglichkeit, SQL-Abfragen zu erstellen. Das Tool erlaubt auch die Möglichkeit, Rechte für das Erstellen der Daten zu vergeben. Das ist auch einer der Schwerpunkte, welche die Entwickler dieses Jahr setzen. Erstellen Benutzer einen virtuellen Datensatz (CREATE VIEW vd AS SELECT), um Informationen mit anderen Benutzern zu teilen, soll sich das in neuen Versionen besser steuern lassen. Hier sollen Administratoren festlegen können, wer Rechte hat, auf Daten zuzugreifen, die durch Abfragen von Apache Drill kommen. Außerdem erlaubt Apache Drill das Definieren einer virtuellen Datenmenge in der Datenquelle, auf die dann nur bestimmte Benutzer Zugriff haben. Diese Benutzer dürfen nur Abfragen für diese Daten erstellen und haben auf andere Daten keinen Zugriff.

6. Sicherheit mit Apache Falcon

Auch Apache Falcon ist ein Big-Data-Projekt, das Bereiche der Sicherheit abdeckt. Im Fokus steht die Möglichkeit, Zugriffsregeln festzulegen und Richtlinien für die Bearbeitung und Verarbeitung von Daten. Neben der Sicherheit lassen sich mit der Anwendung auch Regeln erstellen, wie sich Prozesse und Tools bei Abbrüchen von Abfragen verhalten sollen. Falcon kann daher Workflows in Big-Data-Szenarien integrieren, die nicht nur eine bessere und schnellere Datenverarbeitung liefern, sondern auch mehr Sicherheit. Auch Benachrichtigungen lassen sich integrieren, sodass schnell erkannt werden kann, ob und durch wen ein Workflow oder eine Aktion abgebrochen wurde.

7. Apache Knox – Absicherung von Hadoop-Clustern

Bei Apache Knox handelt es sich um ein REST API Gateway für Hadoop-Cluster. Die Hadoop-Erweiterung ergänzt das Sicherheitsmodell von Hadoop und integriert Authentifizierung und Benutzerrollen für den Zugriff auf die Daten in der Umgebung. Dadurch lassen sich die Zugriffe auch überwachen. Für die Anbindung der Benutzer kann Knox auch auf Active Directory und andere LDAP-Verzeichnisse zugreifen. Auch die Anbindung an andere Authentifizierungsmechanismen ist möglich. Ebenso lassen sich Automatisierungsfunktionen integrieren und Richtlinien erhöhen die Sicherheit.

8. Hadoop mit Apache Chukwa überwachen

Um die Hadoop-Infrastruktur zu überwachen, setzen Administratoren am besten auf Apache Chukwa. Das System setzt auf Hadoop auf und überwacht HDFS-Datenzugriffe. Auch das MapReduce-Framework lässt sich analysieren und überwachen. Chukwa arbeitet mit Knox zusammen, sodass Administratoren für mehr Sicherheit, aber auch für optimale Überwachung des Hadoop-Clusters sorgen können.

9. Sicherheit in Hadoop-Clustern mit Apache Ranger

Mit Apache Ranger können Unternehmen vor allem in Hadoop-Clustern für Sicherheit sorgen. Die Umgebung bietet Sicherheitsrichtlinien und kann deren Umsetzung überwachen. Vor allem für Workloads, Abfragen und Batch-Aufgaben bietet Ranger die Möglichkeit, mehr Sicherheit zu integrieren, indem Richtlinien erfasst und umgesetzt werden. Der Vorteil von Ranger ist, dass die Lösung auch eng mit YARN, SOlr, Falcon und Apache Kafka zusammenarbeitet und sich auch in diese Lösungen integrieren lässt.

10. Datensicherheit mit professionellen Tools

Die beste Sicherheit wird derzeit noch mit Anwendungen erreicht, die kommerziell zur Verfügung stehen, wie zum Beispiel Oracle Audit Vault and Database Firewall. Das Produkt wird nicht nur in Big-Data-Szenarien mit Oracle-Datenbanken eingesetzt, sondern auch bei anderen Projekten. Mit der Lösung lassen sich Protokolldateien verschiedener Lösungen sammeln und auswerten. Neben Oracle-Datenbanken lassen sich Microsoft SQL Server, IBM DB2, SAP und MySQL auswerten. Dazu kommt die Hadoop-Unterstützung.

Auch IBM hat mit InfoSphere Guardium Data Activity Monitor ein solches Produkt im Portfolio. Die Anwendung verhindert unbefugte Zugriffe auf Datenbanken und Anwendungen. Auch diese Lösung arbeitet eng mit Hadoop zusammen.

Kommentar zu diesem Artikel abgeben
100% Sicherheit kann und wird es nicht geben. Ich bin ja auf den ersten Big Data Skandal gespannt....  lesen
posted am 06.03.2015 um 14:54 von Unregistriert


Mitdiskutieren

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 43230674 / Recht & Sicherheit)