Welchem Langzeit-Archivkonzept sollte man den Vorzug geben? Taugen Dateisysteme oder Objekt-Speicher besser für Longterm-Storage?

Autor / Redakteur: Georg Csajkas, iTernity / Rainer Graefen

Unternehmen stehen vor der Aufgabe, die wachsende Menge unstrukturierter Daten für lange Zeitspannen unter Kontrolle zu halten. In diesem Zusammenhang wird aktuell Object Storage als Lösungsansatz und Allheilmittel gepriesen. Aber auch Filesysteme haben ihre Vorzüge.

Best-of-Breed-Ansatz aus Filesystemzugang und Software Defined Object Storage
Best-of-Breed-Ansatz aus Filesystemzugang und Software Defined Object Storage
(Grafik: iTernity)

Angesichts der ungebremst wachsenden Menge unstrukturierter Daten (Big Data) in Unternehmen und Organisationen aller Art sehen sich diese mit neuen Anforderungen an das Information-Management konfrontiert.

Das betrifft das logistische Handling des enormen Datenvolumens allgemein sowie die Sicherung und den Schutz von wichtigen Geschäftsinformationen auf lange Sicht. Die Unternehmen stehen vor der Aufgabe, mit effizienter IT die Kosten von Big Data unter Kontrolle zu halten und gleichzeitig auch die gesetzlichen Richtlinien und interne Sicherheitsanforderungen an das Datenmanagement zu erfüllen.

Bildergalerie

In diesem Zusammenhang wird aktuell „Object Storage“ als Lösungsansatz und Allheilmittel gepriesen. Aber was bedeutet das eigentlich, welche Philosophie steckt dahinter und wo sind die Unterschiede zu filebasierten Speicherarchitekturen bzw. Unified Storage?

Was steckt hinter Object Storage?

Am einfachsten lässt sich die Idee des Object Storage mit einer kleinen Analogie erklären: Stellen Sie sich vor, Sie sind bei Freunden zu einer Party eingeladen, wo Sie Ihre Jacken zu 50 anderen Bekleidungsstücken aufs Schlafzimmerbett werfen, da die Garderobe schon längst übervoll ist.

Natürlich haben Sie sich die Ecke des Bettes gemerkt, aber als sie später gehen wollen, herrscht auf dem Bett ein Riesenchaos und Sie müssen alle Kleidungsstücke durchsuchen, um dann festzustellen, dass Ihre Jacke nicht mehr auffindbar ist ...

Wie schön wäre es gewesen, wenn Sie wie im Theater an der Garderobe Ihre Mäntel abgegeben und dafür eine kleine Marke bekommen hätten? Sie wären am Ende der Veranstaltung mit der Marke zur Garderobe gekommen und hätten Ihren Mantel wiederbekommen! Wie die Garderobiere die Aufbewahrung gelöst hätte, wäre Ihnen dabei völlig egal gewesen.

Object Identifier ...

Dieser zweite, klar geregelte Ansatz ist mit Object-Storage-Systemen vergleichbar, wo für die abgelegten Daten auch jeweils nur ein Key (Garderobenmarke) pro Objekt vergeben wird. Die verwendete flache Hierarchie steht dabei im Gegensatz zu Dateisystemen, wo der Ablageort, die Ordnungsstruktur sowie die Hierarchie genau bestimmt werden müssen (Ordner/Dateinamen).

Aber Object Storage kann noch mehr! Stellen Sie sich vor, Sie haben die sechs Garderobenmarken für Ihre Familie und sollen aus der Jacke Ihrer Frau noch den Lippenstift holen. Wie erkennen Sie die richtige Marke? Wahrscheinlich gar nicht und so müssen Sie sich wohl oder übel alle Jacken zurückgeben lassen und wieder abgeben!

... mit Metadaten

Wäre es nicht toll, wenn auf jeder Garderobenmarke noch weitere Informationen (Ehefrau, Oma, ...) zur Identifikation gestanden hätten?

Im Object Storage bilden Daten (= Jacken) und der jeweilige Key (= Garderobenmarke) mit den Metadaten (Namensschildern) eine Einheit, eben ein Objekt!Unternehmen stehen vor der Aufgabe, die wachsende Menge unstrukturierter Daten unter Kontrolle zu halten. In diesem Zusammenhang wird aktuell Object Storage als Lösungsansatz und Allheilmittel gepriesen.

Des Weiteren kann man mit Object Storage auch noch mehrere Objekte gruppieren und in Containern zusammenfassen, was damit vergleichbar wäre, wenn Sie für alle Mäntel Ihrer Familie nur eine Garderobenmarke bekommen hätten, aber trotzdem jeden Mantel einzeln hätten abholen können.

Archivierung mit Object Storage

Für die unternehmenskritische Aufgabe der Langzeitarchivierung können mit Object-Storage-Systemen zum Beispiel die Aufbewahrungsfrist, der Zeitpunkt der Erstellung und Hashwerte für die Integritätsprüfung als Metadaten direkt mit den eigentlichen Archivdaten abgelegt werden.

Dadurch werden die Archiv-Objekte selbstbeschreibend und überprüfbar und können damit quasi autark durch ihr langes Leben wandern. Daten, die alle wesentlichen, beschreibenden Zusatzinformationen in einer Einheit bei sich tragen, können auf jeder heutigen und zukünftigen Speichertechnologie von beliebigen, auch heterogenen, Herstellern gespeichert werden.

Dabei können sie jederzeit verifiziert werden z. B. über sichere inhaltsbezogene Hashwerte, was weitere Vorteile, wie eine Selbstheilung der Daten ermöglicht. Werden im Monitoring des Archivs kaputte Daten erkannt, können diese durch valide Objekte aus einem gespiegelten Datenpool ersetzt werden.

Regeneration

Dies bietet dem Anwender die höchstmögliche Sicherheit, auch während sehr langer Speicherzeiträume auf valide Daten zugreifen zu können, was von größter Bedeutung ist. Nur durch die Einheit von Daten und Metainformationen kann sichergestellt werden, dass alle Dokumente am Ende der Reise und nach diversen Migrationen noch korrekt ankommen!

Gerade der Aspekt der Datenmigrationen bei Technikwechseln sollte dabei beachtet werden. Denn wer kann schon vorhersagen, wie die Speichertechnik in Zukunft aussehen? Die Entwicklung der Computertechnik in den vergangenen 30 Jahren hat uns eines klar gezeigt: Die Geschwindigkeit und das Ausmaß der Veränderungen ist über einen Horizont von mehr als zehn Jahren überhaupt nicht vorhersehbar.

Langzeitlagerung hat eigene Logik

Daher ist es auf jeden Fall ratsam, sich für langfristig zu bewahrende Informationen eine Strategie zu suchen, die möglichst ohne direkte Technik-Abhängigkeiten auskommt und auf offenen Industriestandards basiert, statt auf proprietären Herstellerlösungen.

Einige objektorientierte Systeme zur Langzeitspeicherung ergänzen die Kernfunktion und integrieren weitere Features wie Kompression und Verschlüsselung, um die sensiblen Daten möglichst klein und geschützt vor neugierigen Blicken für ihre lange Reise zu optimieren.

Bei Aufbewahrungsfristen von zehn, 20 und mehr Jahren (auch aufgrund gesetzlicher Anforderungen) haben Archivdaten noch viel vor sich und werden heutige Entscheider wahrscheinlich überleben. Darauf sollten sie gut vorbereitet sein!

Der gordische Knoten oder Best of Breed

Viele objektbasierte Storage-Lösungen sind derzeit als hardwaregebundene Daten-Silos konzipiert, die separat zur normalen Speicherinfrastruktur aus SAN und NAS im Rechenzentrum betrieben werden. Als zusätzliche Speicherinseln verschlechtern sie durch weiteren Energie- und Flächenverbrauch deutlich die Effizienz im IT-Betrieb und benötigen darüber hinaus extra geschultes Personal und meist auch spezielle Backuptools.

Zudem sind die Anwender bei der Speicherung ihrer sensiblen Daten hier an den jeweiligen Hardware-Hersteller gebunden, was jegliche Flexibilisierung und Virtualisierung enorm erschwert.

Alternativ setzen viele Kunden auf die Kombination der drei Speichersäulen (Block, File, WORM) in Form des sogenannten Unified Data Storage, welches aber dann wieder nicht den objektbasierten Ansatz unterstützt.

Hybridzugriff

Um dieses unbefriedigende „Entweder – Oder“ zu umgehen, entwickelt sich in den letzten Jahren der Trend immer mehr hin zu hybriden Systemen, welche die Vorteile beider Welten verbinden: In Software realisierte, objektbasierte Storage-Lösungen, die auf Filesystemen basieren!

Diese Systeme, auch Software Defined Storage (SDS) genannt, sind ganz normal über das Filesystem und die Standardprotokolle CIFS und NFS zugänglich, können aber intern die inhaltsbezogenen Keys mit den entsprechenden Metadaten als Einheit verwalten.

So können die enormen Vorteile von Object Storage genutzt werden, ohne auf die bewährten und stets weiter entwickelten Filesysteme zu verzichten. Durch die Software-Ebene, welche die genutzte Speicherhardware vom Objektbezug entkoppelt, entstehen für den Anwender zahlreiche Vorteile.

So profitieren die Lösungen z. B. von allen technologischen Fortschritten im Bereich der Filesystementwicklung wie auch im Bereich der Hardware, die praktisch „umsonst“ genutzt werden können.

Die effizientesten Speichertechnologien im Markt finden eben meist nicht direkt Eingang in proprietäre Herstellersysteme.

Dies ist anhand zahlreicher etablierter Lösungen leicht ersichtlich. Die Softwarelösungen lassen sich dagegen mit dem State-of-the-art-Storage kombinieren und können zudem in komplett virtualisierten Umgebungen eingebunden werden, was eine enorme Flexibilität erlaubt.

Charles Darwins zutreffende Feststellung lässt sich auch gut auf Technik übertragen: „Es ist nicht die stärkste Spezies die überlebt, auch nicht die intelligenteste, sondern eher diejenige, die am ehesten in der Lage ist, sich zu verändern.“ Best of Breed ist also die Antwort auf die Titelfrage! Oder: Es kann eben doch manchmal zwei Sieger geben.

(ID:42228579)