Ohne Daten geht es nicht... Business Continuity braucht richtige Speicher-Strategie

Ordnungsmerkmale

erschienen in: <kes> 2005#1, Seite 72

Rubrik: Management und Wissen

Schlagwort: Backup- und Recovery-Strategie

Zusammenfassung: Geschäftsprozesse brauchen Daten. Und deren Verfügbarkeit hängt im Falle eines Falles von einem guten Backup sowie einem schnellen und sinnvollen Recovery ab. Eine effektive und bezahlbare Datenhaltung und -wiederherstellung benötigt dabei eine umfassende Geschäftsanalyse sowie detaillierte Recovery-Planung.

Autor: Von Jürgen Kressig, Langen

Daten-Backup und -Recovery sind zwar durchaus eigenständige Strategien des Datenmanagements. Allerdings sind diese Prozesse eng mit dem Themenfeld Business Continuity verknüpft. Mehr noch: Ohne vernünftige Datensicherung sowie einen Recovery- und Backup-Plan wird es schwer, die Geschäftsprozesse im Falle eines System-Crashs aufrechtzuerhalten. Daher profitieren Unternehmen von Recovery-Plänen, in denen sie jedem Geschäftsprozess und seinen Daten eine spezielle Klassifizierung geben. Durch eine solche Klassifizierung mit dazugehöriger Priorität wird ein Daten-Recovery weitaus erfolgreicher umzusetzen sein.

Mittels eines Recovery-Plans lassen sich aber nicht nur optimale Backup- und Recovery-Strategien erstellen und verwirklichen, sondern auch die damit verbundenen Kosten überwachen: Wenn Strategien, eingesetzte Technik und Kosten derart gegenüberstehen, ist es für Administratoren und IT-Verantwortliche einfacher, Vorteile und finanziellen Nutzen nachzuweisen. So kann man ersehen, ob sich eine geplante Lösung als realisierbar und sinnvoll oder als zu teuer erweist.

Zu einer ausführlichen Planung der Speicher-Strategie gehört die Betrachtung der Applikationen und Anwender sowie der von ihnen genutzten Daten. Hierbei liegt die Unterscheidung in Daten für interne Belange, interne Kundendaten, Daten, auf die auch Kunden Zugriff haben und Transaktionsdaten. Des Weiteren muss festgestellt werden, wie lange Daten ausfallen können beziehungsweise was ein Ausfall das Unternehmen kostet. In diesem Zusammenhang sollte man gleichzeitig erwägen, was ein eventueller (endgültiger) Verlust von Daten bedeutet oder an finanziellen Einbußen mit sich bringt. Auch eine Return-on-Investment-(ROI-)Analyse hilft die Planung umfassend, detailliert und kostengenau zu gestalten.

[Quelle: CNT]
Gründe für Systemausfälle

Priorisierung und Klassifizierung

Eine Datenwiederherstellung erweist sich in den meisten Fällen als schwierig. Für eine sinnvolle Strategie empfiehlt es sich, nicht alle Daten auf einen Schlag "wiederbeleben" zu wollen. Das Recovery-Szenario sollte daher den Geschäftsanforderungen entsprechend ausgearbeitet werden. Dafür gilt es festzustellen, welche Funktionen und Daten wie lange ausfallen dürfen, ohne dass das Unternehmen (unerträgliche) finanzielle Einbußen oder kompletten Verlust von Daten erleidet. Und zwar beizeiten! Eine nachträgliche Priorisierung, welche Daten zuerst benötigt werden, ist während eines (anlaufenden) Restore-Vorgangs schlicht unmöglich.

Um Backup und Recovery zu planen, ist es empfehlenswert, Geschäftsfunktionen und -prozesse in Kategorien zu unterteilen. Einen denkbaren Ansatz stellt die folgende fünfstufige Klassifizierung dar:

In welcher Zeit Daten der Klassen 0 bis 3 wiederhergestellt werden müssen, variiert naturgemäß je nach Unternehmen und Einsatz. Produktionsbetriebe, Internet-Shops oder beispielsweise medizinische Bereiche müssen ihre gesamten Funktionen und Informationen in der Regel schneller wiederherstellen als kleinere Büros. Allerdings dürften bei allen Unternehmen die Klassen 0 und 4 die wenigste Recovery-Planung beanspruchen: Die hochverfügbaren Klasse-4-Daten dürfen erst gar nicht ausfallen, Klasse-0-Daten sind hingegen verzichtbar und bedürfen keines Restore.

Planungsanalyse

Um jeder Daten-Klasse eine adäquate Backup- sowie Recovery-Strategie zuzuweisen, kann eine Fünf-Punkte-Analyse angewendet werden. Diese zieht auch die Kosten der angestrebten Lösung in Betracht und lässt zudem Änderungen zu, falls sie zu hoch ausfallen sollten. Im ersten Schritt evaluiert das Unternehmen seine Geschäftsanforderungen. Das erfolgt in aller Regel durch eine Business-Impact-Analyse (BIA), die sich als Tool für die Recovery-Planung eignet (siehe Kasten). Die BIA stellt fest, welchen Einfluss der Verlust von Daten auf das Unternehmen haben kann: Betriebskosten, finanzieller Verlust, Infrastrukturkosten oder Reputationsverlust, aber auch verlorene Marktanteile oder schwindendes Kundenvertrauen. In diesem Schritt werden die Daten nach den oben angegebenen Kriterien klassifiziert.

----------Anfang Textkasten----------

Business Impact Analyse

Eine Business Impact Analyse (BIA) stellt eine Momentaufnahme eines Unternehmens dar. Sie zeigt nicht nur den Status der technischen Möglichkeiten und verwendeten Strategien, sondern determiniert mögliche Konsequenzen unterschiedlicher Ausfallszenarien. Eine solche Analyse macht das Management auf spezifische Schwachstellen im Unternehmen aufmerksam und liefert zusätzlich die nötigen Daten für Priorisierung und Strategie-Wahl sowie zur Recovery- und Continuity-Planung. So kann der Verantwortliche feststellen, welche Geschäftsbereiche wichtig für das Fortbestehen des Unternehmens sind und wie schnell Daten wiederhergestellt werden müssen, um Verluste zu vermeiden. Welche Ressourcen sich für welche Recovery-Alternativen eignen, legt die BIA ebenfalls dar.

Eine BIA untersucht:

----------Ende Textkasten----------

Im zweiten Schritt, der Recovery-Zielsetzung, wird den Datenklassen ein Restore-Ziel zugeordnet. Die Ziele definieren sich als die Zeit, die das Recovery in Anspruch nehmen darf (Recovery-Time-Objectives, RTO) sowie den spezifischen Zeitpunkt des Restores (Recovery-Point-Objectives, RPO). Die Planung der Recovery-Dauer hängt von mehreren zeitlichen Faktoren ab, wie Hardware-Restore, Aufsetzen von Betriebssystemen, Herstellen von Verbindungen und Softwareinstallationen. Hierbei kann es zu Überlappungen kommen, aber man erreicht dadurch eine realistische Zielsetzung.

Technische Umsetzung

Der dritte Punkt der Analyse erfordert die Festlegung geeigneter Verfahrensweisen für die einzelnen Datenklassen, in Abstimmung mit den individuellen Zielsetzungen. Diese Verfahren sollten in Hinsicht auf tolerierbare Ausfallzeit sowie Wiederherstellungsdauer ausgewählt werden. Für Klasse-4-Daten benötigt man hier kein Verfahren, da diese schlichtweg nicht ausfallen dürfen. Klasse-3-Daten benötigen das robusteste und schnellste Recovery. Hierfür eignen sich unter anderem Hot-Backup-Systeme, Disk-Spiegelungen an entfernten Backup-Standorten, Storage-Area-Networks (SANs), redundante Netzwerke oder Snapshots. Daten der Klasse 2 benötigen ebenfalls Highend-Technik, da sie so schnell wie möglich nach den ersten Recovery-Schritten wieder einsetzbar sein müssen.

Die Methoden für Informationen der Klasse 1 sind eher im Lowend-Bereich anzusiedeln: Sie erfordern keine Redundanzen oder Failover-Möglichkeiten. Solche Backups bestehen aus statischen Server-zu-Server-basierten Systemen, die in die Verantwortung eines Administrators fallen können. Das Recovery selbst kann dann mit wenig oder keinem Planungsaufwand umgesetzt werden. Der Administrator muss zudem beachten, dass ein Wiederherstellen des Netzwerks Teil des Recovery ist. Auch hier lässt sich die Klassifizierung ansetzen, um Verbindungen und Geschäftsfähigkeit nicht zu verlieren.

Eines darf man nicht vergessen: Je besser die Backup-Methode, desto einfacher das Disaster Recovery. Egal wie gut die technischen Geräte sind, die dafür zum Einsatz kommen – das Recovery ist letztlich nur so gut wie das Backup der Daten.

Für die unterschiedlichen Verfahrensweisen sollte man zudem auch das Datenmanagement in den Fokus rücken: Gutes Datenmanagement reduziert die Datenmengen, da durch eine gute Verwaltung – beispielsweise mittels Virtualisierung und hierarchischem Storage-Management (HSM) oder auch eines Policy-based Storage – nur diejenigen Daten gesichert werden, die für das Unternehmen wirklich wichtig sind.

Welche Technik eingesetzt wird, richtet sich nach der vorab bestimmten Backup- und Recovery-Methode. Die Daten, die stets verfügbar sein müssen, benötigen ausfallsichere Systeme, beispielsweise "hochklassige" RAID-Sicherheit, gespiegelte Server oder die Spiegelung an eine zweite Speicherlokalität. Auch die Strategie für Daten der Kategorie 3 muss mit Highend-Technik umgesetzt werden: Hier wären Server-Cluster, redundante Netzwerke oder Replikationen möglich. Für Klasse-2-Daten reichen beispielsweise redundante Hardware-Konfigurationen oder Tape-Autoloader. Schlichte Festplatten (im Jargon: "Just a Bunch of Drives" – JBODs) sowie einzelne Tape-Drives lassen sich für die Klasse-1-Daten verwenden.

Kosten

Der letzte Schritt der Analyse befasst sich mit den Kosten, die vor allem von den technischen Geräten bestimmt werden. Die höchsten Kosten erzeugen dabei die technischen Mittel für Klasse-3- und -4-Daten. Generell steigen die Kosten naturgemäß proportional mit den Anforderungen an das Backup und Recovery der Daten.

Von den genannten fünf Schritten stellt die Kostenbetrachtung eigentlich den Abschluss der Analyse dar. Da sich hier aber oft unerwartet hohe Kosten zeigen, empfiehlt sich in solchen Fällen eine Validierung der vorherigen Analyseschritte. Erneute Prüfungen, wo man sinnvoll sparen kann, helfen dem Verantwortlichen die Planung anzupassen. Natürlich gilt es weiterhin abzuwägen, welches Risiko für die Firma verträglich ist. Übermäßige oder unüberlegte Einsparungen am Backup und Disaster Recovery können ebenso verhängnisvolle Folgen haben wie ein schlecht geplantes Backup oder Recovery.

Prinzipiell ist jedoch festzustellen, dass ein Fehlen des Backup- oder Recovery-Plans beziehungsweise ein schlechtes Backup ein Unternehmen teuer zu stehen kommen kann: Bei einem Datenverlust zeigen sich die Wiedergewinnung oder gar der Verzicht auf bestimmte Daten als immens kostenaufwändiger als ein zuvor festgelegtes Backup- und Recovery-Szenario.

Business Continuity durch Storage-Planung

Oft wird Disaster Recovery mit Business Continuity gleichgesetzt – dem ist aber nicht so. Disaster Recovery ist nur ein Teil einer ganzheitlichen Business-Continuity-Strategie, deren Ziel die Aufrechterhaltung des Geschäftsbetriebes ist, unabhängig davon, was der Grund für eine ungeplante oder geplante Betriebsunterbrechung ist.

Unternehmen, die heute noch manuelle Backups für einzelne Abteilungen einsetzen und ihren Datenbestand nicht kennen, werden im Falle eines System-Crashs diese "Seifenblase" ihres Sicherheitskonzepts platzen sehen. Planung und Strategie sowohl für Backup als auch Disaster Recovery retten nicht nur Informationen, sondern gewährleisten Unternehmen ihre Geschäftstüchtigkeit. Was auf den ersten Blick als unbequeme organisatorische Arbeit erscheint, ist eine lohnende Investition zur Abwendung finanzieller Verluste bei einem Daten-Crash. Firmen sollten genau darauf achten, welche Daten sie besitzen und wie sie damit umgehen. Analyse und Planung liefern eine gute Übersicht über die Infrastruktur, das Datenverhalten seitens der Anwender sowie Schwachstellen im Unternehmen.

Jedes Disaster Recovery und jeder Restore kann nur so gut sein wie sein Backup. Ein detaillierter Backup-Plan gewährleistet, dass die richtigen Daten im Falle einer Notsituation wiederherstellbar sind. Der Recovery-Plan sorgt darüber hinaus für eine schnelle und einfache technische Umsetzung und einen reibungslosen Ablauf beim Restore.

Jürgen Kressig ist Strategic Alliance Manager, Central Region Europe bei der CNT GmbH ([externer Link] www.cnt.de)