Systeme und ihr Umfeld

Backup

Backup am laufenden Band

Von Jörg Kurowski, München

Angesichts der immensen Datenmengen lassen sich Backup-Prozesse heute kaum noch von Hand bearbeiten. Trotz gestiegener Bandkapazitäten sind hierzu große Mengen von Backup-Bändern zu verwalten. Hilfe versprechen automatisierte Tape Libraries und die Einbindung in Storage Area Networks (SAN).

Jedes Jahr wächst die Datenmenge in Unternehmen aufgrund komplexer Anwendungen wie E-Business-Lösungen und ERP-Systemen (Enterprise Resource Planning) durchschnittlich um mindestens 100 Prozent. Würde man das Datenvolumen, das pro Tag weltweit per Internet übertragen wird (etwa 10 000 Terabyte), in Buchform stapeln, so entspräche das der Strecke bis zum Mond – 384 401 Kilometer. Diese im wahrsten Sinne des Wortes astronomischen Datenvolumina erfordern zuverlässige Speichermedien mit hoher Kapazität sowie effiziente Verfahren für das Backup und die Medienverwaltung. Der Zeitbedarf für die Datensicherung und die damit verbundene Server-Auszeit wächst synchron mit den Datenmengen – ein technologisches und betriebswirtschaftliches K.o.-Kriterium im Zeitalter der Rund-um-die-Uhr-Verfügbarkeit von IT-Systemen.

Der Routineprozess Backup ist dem Endanwender selten bewusst. In Unternehmen gilt laut einer aktuellen Studie des Marktforschungsunternehmen IT Centrix das Daten-Backup durch die massiv wachsenden Datenmengen für 25 Prozent der IT-Verantwortlichen als dringlichste Herausforderung – noch vor Fragen des Wachstumsmanagements, der Performance oder der Verfügbarkeit. Dies gilt insbesondere für den immer populärer werdenden Open-Systems-Bereich (UNIX- und Windows NT/2000-Anwendungen).

In der Backup-Praxis stehen dem IT-Verantwortlichen für die Vielzahl divergierender technischer Herausforderungen wie niedrige Datentransferraten und hohe Serverbelastungen ein breites Spektrum an traditionellen und neuen Speichermedien sowie Datensicherungs- und Datenmanagementstrategien zur Verfügung. Für den Server-Bereich bietet die Datensicherung auf Magnetband im Vergleich zur Festplatte überzeugende Vorteile: Vorrangig ist dabei vor allem der günstige Preis verbunden mit der durchschnittlich zehnfach höheren Speicherkapazität von Bandmedien.

Zu den aktuellen Bandformaten gehören das Helikal-Aufzeichnungsformat

Beim Helical Scan beschreibt eine rotierende Kopftrommel das Magnetband ähnlich wie bei Videorecordern in diagonal zur Laufrichtung angeordneten Spuren. Die Vorteile: hohe Speicherdichte und geringe mechanische Belastung der Bänder durch niedrigere Bandgeschwindigkeit. Der Nachteil sind langsame Zugriffszeiten.

Linear-Scan-Verfahren zeichnen die Daten auf linearen Spuren parallel zur Laufrichtung des Bandes auf, was einen schnelleren Datenzugriff ermöglicht. Allerdings zum Preis höherer mechanischer Belastung und geringerer Speicherdichte (längeres Band pro Gigabyte). Die wichtigsten Kennzahlen der aktuellen Bandformate zeigt Tabelle 1.

Im Jahr 2000 kamen mit LTO-Ultrium und SuperDLT zwei neue Bandformate auf den Markt, die neue Maßstäbe in Sachen Speicherkapazität und Datentransferraten setzten. Im laufenden Jahr 2001 wird auch Sony die Leistungsmerkmale seines AIT-Formates in der dritten Generation im Hinblick auf den wachsenden Speicherbedarf optimieren. Die zunehmende Speicherkapazität pro Band berücksichtigt, dass den Anwendern immer weniger Platz zur Archivierung ihrer Datenmengen zur Verfügung steht. Gleichzeitig verkürzt eine hohe Datentransferrate den Zeitbedarf für das Backup und verkleinert damit das Backup-Fenster.

  AIT-3 SuperDLT LTO-Ultrium
Native Speicherkapazität pro Band [GByte] 100 110 100
Datentransferrate [MByte/s] 12 11 15

Tabelle 1: Kennzahlen aktueller Bandformate

----------Anfang Textkasten----------

Die Qual der Wahl – das optimale Backup-Verfahren

Die Wahl des passenden Speichermediums geht Hand in Hand mit der Festlegung des Backup-Verfahrens. Ob man einem einzelnen Verfahren zur Datensicherung den Vorzug gibt (z. B. tägliches Voll-Backup) oder die drei prinzipiellen Möglichkeiten miteinander kombiniert, ist eine Frage der unternehmensspezifischen Sicherheitsanforderungen.

Voll-Backup:
Sicherung des gesamten Datenbestandes.
Differential Backup:
Sicherung der Änderungen seit dem letzten Voll-Backup. Die gesicherten Daten werden nicht markiert. Beim nächsten Differential Backup sichert das System wieder alle Änderungen seit dem letzten Voll-Backup.
Incremental Backup:
Sicherung der Änderungen seit dem letzten Backup. Die gesicherten Daten werden als solche markiert, sodass nur die Änderungen seit dem letzten Voll- oder inkrementellen Backup gespeichert werden.

[Je länger der Backup-Vorgang dauert, desto schneller ist ein anschließendes Daten-Restore.]
Je länger der Backup-Vorgang dauert, desto schneller ist ein anschließendes Daten-Restore.

----------Ende Textkasten----------

Optimales Backup durch Automatisierung

In Anbetracht der heutigen Datenvolumina steht bei der Auswahl von Bandmedium und Backup-Verfahren der Automatisierungsaspekt im Vordergrund. Bis Anfang der Neunziger Jahre sicherten viele Unternehmen – auch in Großrechenzentren – ihre Daten manuell: Fachkräfte legten von Hand Bänder in die entsprechenden Laufwerke ein und übernahmen auch deren Verwaltung. Die wachsenden Datenmengen führten unter diesen Umständen oftmals zu einem Dreischichtbetrieb. Heute verzichtet kaum noch ein Unternehmen auf die Vorteile der automatisierten Datensicherung mithilfe von Bandspeicherbibliotheken (Tape Libraries). Neben der Einsparung von Personalkosten (inklusive kostspieliger Schichtzulagen) umgeht diese Automatisierung die menschliche Fehlbarkeit. Laut einer Untersuchung von Contingency Planning Research geht immerhin ein knappes Drittel aller Datenverluste auf menschliches Fehlverhalten zurück, 68 Prozent auf Hard- und Software-Fehler.

Heutige Bandspeicherbibliotheken integrieren Bandkassetten in homogener oder auch gemischter Zusammenstellung zusammen mit den entsprechenden Laufwerken. Robotergreifarme übernehmen das Einlegen und Entnehmen der Kassetten in die Laufwerke und gewährleisten somit ein vollautomatisches Backup. Häufig sind die Systeme sukzessive aufrüstbar, sodass spätere Mehranforderungen keine vollständige Neuanschaffung bedeuten.

[Foto: ADIC Scalar 10k]
Heutige Bandspeicherbibliotheken können immense Mengen von Bändern auf wenigen Quadratmetern zur automatisierten Auswahl per Roboterarm vorhalten. Der Scalar 10k von ADIC fasst beispielsweise in der Maximalkonfiguration 15 880 LTO-Bänder und 648 Laufwerke.

Die High-end-Geräte ermöglichen die Speicherung und Verwaltung großer Datenvolumina bei hoher Ausfallsicherheit. Beispielsweise kann der Scalar 10K von ADIC mehrere Bandformate gleichzeitig in einer Tape Library verwalten, sodass der Anwender das Gerät ständig an seine individuellen Backup-Bedürfnisse anpassen oder neue Technologien integrieren kann. Die unkomprimierte Speicherkapazität des Scalar-10K-Basismoduls mit LTO beträgt über 881 Terabyte bei einer Speicherdichte von mehr als 900 Bandstellplätzen pro Quadratmeter. In seiner Maximalkonfiguration fasst das skalierbare Bandspeichersystem über 15 880 LTO-Bänder und 648 Laufwerke. Dabei garantieren umfangreiche Redundanz-Merkmale hohe Verfügbarkeit. Dazu gehören zwei unabhängige Spannungsquellen, die im laufenden Betrieb austauschbar sind. Auch die Bandlaufwerke sind "hot swappable"; die Tape Library kalibriert sich automatisch nach jedem Austausch selbst. Das System verfügt zudem über redundant arbeitende Library-Kontrolleinheiten und zwei unabhängige Anschlüsse für die Datenübertragung.

Außerdem bieten Systeme wie der Scalar 10K Leistungsmerkmale, um Verwaltungs- und Betriebskosten zu minimieren, die typischerweise höher sind als jene für die eigentliche Speicher-Hardware. Eine integrierte Verwaltungs-Software unterteilt das Gesamtsystem in kleinere virtuelle Einheiten, wodurch eine Library gleichzeitig verschiedene angeschlossene Applikationen unterstützen kann. Eine Web-Schnittstelle ermöglicht die Fernverwaltung, E-Mail-Alerts informieren die Administratoren sofort über kritische Systemzustände. Über eine passwortgeschützte Mailbox können während des laufenden Betriebs sicher Bänder entnommen oder hinzugefügt werden.

[Foto: Roboterarm einer Tape Library]
Viele Tape Libraries sind erweiterbar. Dabei reichen sich je nach Anbieter entweder mehrere Roboterarme die Kassetten weiter (Pass-Trough-Ports) oder man verlängert in x/y-Achsen-Konstruktionen beim Anschluss von Erweiterungsmodulen die x-Achse.

Die neue Speicheralternative – Storage Area Networks (SANs)

In den letzten Jahren hat sich unabhängig von der Entwicklung neuer Bandformate und Automatisierungstechnologien ein neuer Speicherterminus etabliert. Storage Area Networks (SANs) bieten angesichts der wachsenden Backup-Anforderungen und überlasteten Unternehmensnetzwerke eine Alternative zur etablierten Datensicherung. Die Marktzahlen für SAN-Produkte sprechen dabei für sich: 1998 wurden damit laut der International Data Corporation (IDC) weltweit mehr als 2,7 Milliarden US-Dollar Umsatz erwirtschaftet, diese Zahl erhöhte sich 1999 um 20 Prozent auf über 3,2 Milliarden US-Dollar. Für das Jahr 2001 erwarten die Experten von IDC ein Umsatzvolumen von mehr als sechs Milliarden US-Dollar.

In einem SAN können Speicherressourcen von unterschiedlichen Servern genutzt werden. Innerhalb heterogener Netzwerke ist dadurch eine Speicherkonsolidierung möglich. In der Praxis können zum Beispiel mehrere Server im Rahmen von Backup- und Restore-Vorgängen direkt auf eine Tape Library und ihre Bandlaufwerke zugreifen. Die Datenübertragung erfolgt auch über größere Entfernungen mit hoher Geschwindigkeit (ein Gigabit pro Sekunde) und ohne Belastung des LAN (Local Area Network), wodurch Backup-Server und LAN als limitierende Faktoren für die Datensicherung ausscheiden.

Als verbindende Infrastruktur fungiert Fibre Channel (FC), eine serielle Hochgeschwindigkeitsdatentransfer-Technik, die sowohl durch Glasfasern als auch über konventionelle Kupferleitungen realisiert wird. Dieser offene Standard wird unter anderem durch das American National Standards Institute (ANSI) definiert und unterstützt alle wesentlichen Übertragungsprotokolle – zum Beispiel Small Computer System Interface (SCSI) und Internet Protocol (IP). FC verfügt über kein eigenes Protokoll auf Applikationsebene, sondern verpackt die Datensätze der herkömmlichen Protokolle (SCSI, IP) auf Hardware-Ebene in FC-Pakete. Dadurch lassen sich bereits existierende Applikationen weiterhin nutzen.

Die Einbindung der SCSI-Speicher-Hardware in ein SAN funktioniert über spezielle, zum Teil in die Backup-Systeme integrierte, Router, die die Umwandlung der SCSI- in FC-Pakete und damit eine Integration in SAN-Infrastrukturen ermöglichen. Bei der Auswahl von Tape Libraries sollte man darauf achten, dass sie möglichst die SAN- und SCSI-Übertragungstechnologien mehrerer Hersteller unterstützt. Dass SAN "richtige" Netzwerke sind, belegt übrigens auch das Aufkommen spezieller Firewall-Systeme, die Daten vor unautorisiertem Zugriff schützen sollen.

Jörg Kurowski ist Regional Director Central Europe bei [externer Link] ADIC.

© SecuMedia-Verlags-GmbH, D-55205 Ingelheim,
KES 4/2001, Seite 14