Definition

Was ist ein Distributed File System?

| Autor / Redakteur: Michael Radtke / Nico Litzel

(© aga7ta - Fotolia)

Ein Distributed File System (DFS; auf Deutsch: verteiltes Dateisystem) ist ein wesentlicher Bestandteil eines Betriebssystems und ermöglicht über ein Rechnernetz den Zugriff auf in den Fileservern abgelegte Dateien.

Grundsätzlich zählt das verteilte Dateisystem zu den File-Service-Protokollen. Der jeweilige Administrator erhält dabei die Möglichkeit, ein netzwerkübergreifendes Dateisystem aufzubauen. Dieses enthält oftmals die verschiedenen Freigaben für die jeweiligen Server. Ein Dateisystem dieser Art ist grundsätzlich hierarchisch strukturiert und verfügt über eine logische, einheitliche Namenskonvention. Selbst wenn ein Benutzer den Standort des Servers nicht kennt, kann er eine Freigabe anfordern. Die Suche nach Dateien wird dabei unternehmensweit durch die zentrale Baumstruktur erleichtert.

Das Distributed File System arbeitet generell mit dem Network File System (NFS), dem Server Message Block (SMB) sowie dem Andrew File System. Eingesetzt werden kann das Distributed File System in Server-Umgebungen, die auf Microsoft Windows (ab Version 2000), NetWare oder Unix basieren. Zum Vergleich: Das klassische Gegenstück zu einem derartigen Dateisystem bildet ein lokales Dateisystem, das direkt an den jeweiligen Computer angeschlossene Massenspeicher verwaltet.

Oft genutzt – das Distributed File System von Microsoft

In der Praxis vorwiegend genutzt wird das Distributed File System von Microsoft, mittels dem dann eben im Rechnernetz verteilte Verzeichnisse zu ganzheitlichen Verzeichnisstrukturen zusammen gestellt werden können. Dabei erscheinen die Verzeichnisse den Benutzern zwar als in sich geschlossene Struktur, dennoch können sie sich aber auf unterschiedlichen Datenspeichern befinden. Allerdings stammt das grundlegende Konzept des Distributed File System nicht von Microsoft selbst; diesbezüglich gibt es dann auch von verschiedenen Herstellern unterschiedliche Implementierungen.

Mehrere Komponenten

Die entsprechende Topologie (hier: Netzstruktur eines Rechnernetzes) des Distributed File System setzt sich aus einem als DFS-Stamm fungierendem Verzeichnis und Verknüpfungen auf die jeweiligen Zielverzeichnisse zusammen. Falls Bedarf besteht, können zudem Replikate zu den einzelnen Zielverzeichnissen angelegt werden. Mit diesen können die enthaltenen Dateien dann automatisch abgeglichen werden. Allerdings ist es in einem solchen Fall dann nicht möglich, gezielt zu steuern, ob Anwender auf ein etwaig noch gar nicht aktuelles Replikat oder auf das eigentliche Zielverzeichnis zugreifen.

Zwei verschiedene Varianten

Es können prinzipiell zwei Varianten bzw. Versionen eines DFS-Stammes angelegt werden. Zum einen handelt es sich dabei um einen eigenständigen DFS-Stamm. Dieser verfügt im Endeffekt aber lediglich über eine einzige DFS-Verknüpfungsebene und auf Stammebene über keine frei gegebenen DFS-Ordner. Handelt es sich dagegen um einen Domänenbasierenden DFS-Stamm, hat ein Anwender zu jeder Zeit Zugriff auf frei gegebene Distributed-File-System-Ordner. Zudem verfügt ein domänenbasierender DFS-Stamm oftmals über gleich mehrere Ebenen von DFS-Verknüpfungen. Außerdem wird ein DFS-Stamm dieser Art automatisch im Active Directory veröffentlicht werden und des Weiteren auf einem Mitgliedsserver der jeweiligen Domäne installiert bzw. eingerichtet sein.

Zahlreiche Implementierungen

Neben dem Distributed File System von Microsoft können Anwender zudem noch auf eine große Bandbreite anderweitiger Implementierungen zurückgreifen. In diesem Zusammenhang ist vor allem Coda eine wichtige Begrifflichkeit. So handelt es sich bei Coda um ein Dateisystem, das in einem Netzwerk verteilt ist, und explizit für stationäre und auch mobile Rechner konzeptioniert wurde. Coda ist dabei bereits im Jahr 1987 bei einem Forschungsprojekt an der Carnegie Mellon University in Pittsburgh (USA) entstanden. Mit diesem Dateisystem können in der Regel mehrere Rechner gleichzeitig arbeiten, wobei die Inhalte – zwecks Erhöhung der Systemverfügbarkeit – auf mehrere Server zu verteilen sind.

Lustre und ClusterFS

Wer Cluster Computing betreibt, sollte sich demgegenüber mit Lustre befassen. Das ist ein paralleles, verteiltes Dateisystem, das eine offene Lizenzierung sowie eine explizit hohe Leistungsfähigkeit aufweist. Daher wird das Dateisystem Lustre auch oftmals in so bezeichneten Supercomputern eingesetzt. Des Weiteren sind die Implementierungen BeeGFS/FhGFS für HPC-Anwendungen und Cluster von entscheidender Bedeutung. Hierbei handelt es sich um ein paralleles Dateisystem, das im Hinblick auf den Datendurchsatz für den Einsatz im Bereich High Performance Computing ausgelegt. ist.

GPFS von IBM

Geht es um die leistungsstarke und optimale Speicherung von Daten, vertrauen viele Administratoren auch dem von IBM entwickelten General Parallel File System (GPFS). Als eine bekannte Implementierung präsentiert sich letztendlich auch das verteilte Dateisystem GlusterFS, welches - als einheitliches Dateisystem - Speicherelemente von mehreren Servern (hier: Cluster-Nodes) präsentiert. Die verschiedenen Server bilden dabei eine Client-Server-Architektur über TCP/IP.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Aktuelle Beiträge zu diesem Thema

Vom Umgang mit großen Datenmassen

Buchrezension Big Data

Vom Umgang mit großen Datenmassen

Die durch die Digitalisierung und das Internet of Things entstehenden Datenmassen können mit konventionellen Mitteln relationaler Datenbanken nicht mehr bewältigt werden. Dazu braucht es andere Mittel und Methoden. Das Buch „Big Data“ beschreibt sie. lesen

Alexa spricht Splunk

Nachbericht Splunk .conf 2018

Alexa spricht Splunk

Splunk, ein Spezialist für die Analyse von Maschinendaten, adressiert eine breitere Nutzerschicht, nämlich die Mitarbeiter in den Fachbereichen. Zahlreiche neue Funktionen, wie etwa mobile Apps und Sprachausgabe, sollen ihnen das Leben erleichtern. Neben zahlreichen Neuerungen in den Kernprodukten stellte Splunk seine eigene IIoT-Plattform für Industrie 4.0 vor. lesen

Microsoft vereinfacht Entwicklung digitaler Zwillinge

Sichere IoT- und Edge-Lösungen

Microsoft vereinfacht Entwicklung digitaler Zwillinge

Im Rahmen der Ignite 2018 hat Microsoft in Orlando/Florida gezeigt, wie Unternehmen mit Künstlicher Intelligenz (KI), dem Internet der Dinge (IoT) und Edge Computing die Digitalisierung vorantreiben können. lesen

SQL-on-Hadoop für den Enterprise-Einsatz

Apache HAWQ wird Top-Level-Project

SQL-on-Hadoop für den Enterprise-Einsatz

Das Apache HAWQ-Projekt ist zu einem Top-Level-Projekt innerhalb der Apache Software Foundation geworden. Apache HAWQ ist eine Enterprise SQL-on-Hadoop Query Engine und Analysedatenbank, die erstmals im September 2015 in die Inkubationsphase der Stiftung eingetreten ist. lesen

Daten gehören zum wichtigsten Kapital eines Unternehmens

Kommentar von Benjamin Krebs, Dell EMC

Daten gehören zum wichtigsten Kapital eines Unternehmens

Die Digitale Transformation verändert die Welt. Experten prognostizieren, dass in den nächsten drei Jahren die Hälfte der globalen Wertschöpfung digital entsteht. Der Einsatz von Daten und die Behandlung von Daten als Unternehmenskapital treiben diesen Wandel entscheidend voran. Durch die Fähigkeit, Daten gezielt für das eigene Geschäft zu nutzen, werden sich die Gewinner von den Verlierern unterscheiden. lesen

Mit Künstlicher Intelligenz profitable Geschäfte machen

Mensch, Prozesse, Technologie

Mit Künstlicher Intelligenz profitable Geschäfte machen

Der erfolgreiche Einsatz Künstlicher Intelligenz im Unternehmen beginnt mit Menschen und Geschäftsprozessen – erst danach kommt die Technologie. Vor der Einführung entsprechender Lösungen sollten Führungskräfte eine Vision entwickeln, wie KI ein profitables Geschäft antreiben kann. lesen

Matlab erhält Toolbox für Entwurf und Testen von Algorithmen

Predictive Maintenance

Matlab erhält Toolbox für Entwurf und Testen von Algorithmen

Die neue Predictive Maintenance Toolbox in Matlab bietet Funktionen und Referenzbeispiele für Entwickler, die Algorithmen entwerfen, um Daten zu strukturieren, Zustandsindikatoren zu erstellen, Maschinenzustände zu überwachen und die wirtschaftliche Restlebensdauer zu schätzen und so Geräteausfälle zu vermeiden. lesen

Integration von Big Data – Nissan und der Data Lake

Kommentar von Daniel Metzger, Hortonworks

Integration von Big Data – Nissan und der Data Lake

Den Smart Cars gehört die Zukunft. Vernetzte Automobile können eine Reihe von Diensten bereitstellen, die sich auf Fahrdaten, Fahrzeugstatus und Straßenzustände in der Nähe stützen. Nissan ist bei der Forschung auf diesem Gebiet bereits seit langer Zeit dabei. lesen

IoT-Basics – die technische Basis von Big Data

Data Science

IoT-Basics – die technische Basis von Big Data

Big Data beinhaltet eine Reihe von IT-Techniken wie Cluster Computing und MapReduce sowie mathematisch-statistischer Verfahren (Data Mining, Machine Learning). Der Beitrag gibt einen Überblick über die relevanten Datenbankenkonzepte (Hadoop- und NoSQL-Datenbanken) und Programmiersprachen. lesen

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 44474637 / Definitionen)