Server

DRBD

aus Wikipedia, der freien Enzyklopädie

Wechseln zu: Navigation, Suche
Übersicht des DRBD-Konzepts
Übersicht des DRBD-Konzepts

DRBD (Distributed Replicated Block Device). Als Kernel-Modul zusammen mit einer Management-Applikation im Userspace und einem Skript, dient es dazu, ein Blockgerät auf einem produktiven (primary) Server in Echtzeit auf einen anderen (secondary) Server zu spiegeln. Dieses Verfahren wird verwendet, um Hochverfügbarkeit(HA) im UNIX/Linux-Umfeld zu realisieren und somit eine gute Verfügbarkeit verschiedener Dienste zu erreichen.

Inhaltsverzeichnis

[Bearbeiten] Funktionsweise

Es werden alle Schreibzugriffe über das Netzwerk an den zweiten Server übermittelt. Erst wenn der zweite Server den erfolgreichen Schreibvorgang an den ersten Server zurückgemeldet hat, meldet dieser der Applikation das Ende des Schreibvorgangs (diese Technik ist vergleichbar mit einem RAID 1 über TCP/IP). Falls der erste Server ausfällt, wird dieser als inaktiv gemeldet. Durch eine Serverüberwachungssoftware wie Heartbeat kann der zweite Server die Funktion des ersten Servers übernehmen und mit denselben Daten weiterarbeiten.

Jede DRBD-Komponente (lokal auch als Partition bezeichnet) besitzt einen Status, welcher entweder primär oder sekundär sein kann. Zwischen allen Systemen erzeugt DRBD eine Verbindung von der lokalen Partition zu einem virtuellen Gerät /dev/drbdX, welches nicht direkt angesprochen werden kann. Schreibzugriffe auf das primäre System werden über das low-level-Blockgerät (die Partition) und gleichzeitig an das sekundäre System propagiert. Das sekundäre System übermittelt dann die Daten an sein eigenes lokales low-level-Blockgerät. Alle Lesezugriffe werden stets lokal durchgeführt.

Sollte das primäre System ausfallen, versetzt ein Cluster-Management-Prozess das sekundäre System in den primären Systemzustand. Dieser Übergang macht es evtl. erforderlich die Integrität des auf DRBD überliegenden Dateisystems zu überprüfen. Dies geschieht entweder durch einen Dateisystemcheck(fsck) oder durch Zurückspielen eines Dateisystemjournals. Wenn das ehemals primäre System wieder verfügbar ist, wird dieses nach einer Resynchronisation der Gerätedaten wieder in den primär Status versetzt (oder auch nicht). Der Algorithmus der DRBD-Synchronisation arbeitet dadurch effizient, dass nur während des Ausfalls geänderte Datenblöcke wieder resynchronisiert werden müssen, nicht das ganze Gerät.

In der im Januar 2007 erschienenen Version 8 der DRBD wurde eine Unterstützung für Konfigurationen mit Lastverteilung eingeführt, welches beiden Systemen ermöglicht, einzelne DRBDs im Lese-/Schreib-Modus wie bei gemeinsam genutzten Speicher(shared storage) zu nutzen.[1] Diese Art der Nutzung erfordert die Verwendung eines Sperrmechanismus, dem "distributed lock manager".

[Bearbeiten] Vorteile gegenüber gemeinsam genutztem Cluster-Speicher

Konventionelle Computer-Cluster-Systeme benutzen in der Regel eine Art gemeinsamen Speicher, der für die Clusterressourcen benutzt wird. Dieser Ansatz hat jedoch eine Reihe von Nachteilen, die DRBD umgeht.

  • Gemeinsam genutzte Speicher (shared storage) bringen typischerweise eine einzelne Fehlerstelle (Single Point of Failure) mit sich, da beide Clustersysteme vom gleichen gemeinsamen Speicher abhängig sind. Bei der Verwendung von DRBD besteht hier keine Gefahr, da die benötigten Clusterressourcen lokal repliziert werden und nicht auf einem eventuell wegfallenden gemeinsamen Speicher liegen.
  • Gemeinsam genutzter Speicher ist außerdem sehr anfällig für sogenannte "split brain" Situationen, bei denen zwar beide Clustersysteme verfügbar sind, diese sich jedoch aufgrund etwa fehlerhafter Netzwerkkommunikationen nicht mehr abstimmen können und jeweils davon ausgehen, dass das andere System nicht mehr verfügbar sei. In diesem Fall würde jedes der beiden Systeme in den primären Status wechseln und alle Clusterressourcen übernehmen. Dies kann fatale Folgen haben, wenn z.B. beide Systeme versuchen sollten, dieselben Dateisysteme zu benutzen und zu beschreiben. Clusteradministratoren sollten deshalb eine Systembegrenzungspolicy festlegen, um dies zu vermeiden. DRBD verhindert dies, indem es zwei getrennte Datensätze anstelle eines gemeinsam genutzten verwendet.
  • Gemeinsam genutzter Speicher wird in der Regel über ein SAN oder ein NAS adressiert, was einen gewissen Mehraufwand beim Lesezugriff erfordert. Bei DRBD wird dieser Aufwand signifikant reduziert, da Lesezugriffe immer lokal stattfinden.

[Bearbeiten] Anwendungen

DRBD arbeitet innerhalb des Linux-Kernels auf Blockebene und ist damit für darauf aufsetzende Schichten transparent. DRBD kann somit als Grundlage verwendet werden für:

  • konventionelle Dateisysteme
  • gemeinsam genutzte Cluster-Dateisysteme wie z.B. GFS or OCFS2
  • ein weiteres logisches Blockgerät wie z.B. LVM
  • jede Applikation, die den direkten Zugriff auf ein Blockgerät unterstützt.

DRBD-basierende Cluster werden häufig eingesetzt, um Dateiserver und relationale Datenbanken (wie MySQL) um synchrone Replikation und Hochverfügbarkeit zu erweitern.

[Bearbeiten] Mögliche Aufnahme in den Linux-Kernel

Im Juli 2007 stellten die DRBD-Autoren die Software der Linux-Entwicklergemeinde für eine mögliche zukünftige Aufnahme von DRBD in den offiziellen Linux-Kernel zur Verfügung.[2] Die Begutachtung läuft derzeit.

[Bearbeiten] Quellen

  1. Philipp Reisner: DRBD v8 - Replicated Storage with Shared Disk Semantics. In: Proceedings of the 12th International Linux System Technology Conference. 2005.
  2. Lars Ellenberg: DRBD wants to go mainline. linux-kernel-Mailingliste. 21. Juli 2007.

[Bearbeiten] Weblinks

Commons
 Commons: DRBD – Bilder, Videos und Audiodateien
Copyright © 2005-2010 Hardware-Aktuell. Alle Rechte vorbehalten.