Management und Wissen

Backup

Geordnete Bandsicherung

Von Stefan Hillenbach, Berlin

Häufig nutzen Rechenzentren ihre vorhandenen Bandkapazitäten nur ungenügend. Eine strukturierte Sicherung von Dateien per Tape-Stacking-Verfahren schafft hier Abhilfe. Bei der Auswahl der geeigneten Methoden stehen auf Wunsch Dienstleister hiflreich zur Seite.

Festplatten, Datensicherung, Bänder – diese Begriffe verbinden IT-Profis mit dem Wort Speicher. Doch auch "im richtigen Leben" existiert der Speicher. Dort heißt er Keller und die Gemeinsamkeiten sind frappierend: Oft sind beide nicht aufgeräumt und eine Auseinandersetzung damit setzt erst ein, wenn zu wenig Platz vorhanden ist oder wenn man ihn aufgeben muss. Denn wer geht schon gerne freiwillig in den Keller zum Aufräumen? In der IT gibt es für solche Aufgaben praktischerweise Dienstleister, die einem das Aufräumen abnehmen und dabei idealerweise direkt und dauerhaft für Ordnung sorgen.

In der Vergangenheit wurde – eher unabsichtlich – mit dem Hauptspeichermedium Band sehr großzügig umgegangen: Die Bänder – vom Tape-Management-System verwaltet und zu zigtausenden in Automated Tape Libraries (ATL) mit vollautomatischen Roboterzugriff aufbewahrt – sind in Rechenzentren (RZ) statistisch gesehen nur zu circa 40 Prozent ausgelastet. Ein Zustand, der mit dem allseits propagierten rasanten Wachstum der Datenmenge nicht mehr tragbar ist. Angesichts der vorhandenen Datenflut, aber auch um Kosten zu reduzieren, steht daher in vielen Unternehmen eine gründliche Aufräumaktion an.

Das Speichern von Daten auf Band hat eine lange Tradition in der Datenverarbeitung und wurde im Bereich der Massendatenhaltung bislang von keiner anderen Technologie abgelöst. Dennoch arbeitet diese traditionelle Methode nicht unbedingt effektiv. Ein Grund für die geringe Ausnutzung der Speicherkapazität eines Bandes liegt in der identischen Belegung der Speicheradresse, dem so genannten Label 1, für jede Datei, wenn das speichernde Programm ein leeres Band (Scratch-Band) anfordert. Jede Datei belegt dann ein eigenes Band, egal welche Größe sie tatsächlich hat.

Da nun das Volumen der in Unternehmen erzeugten und verarbeiteten Daten explosionsartig wächst, stellt sich für viele Unternehmen die Frage, wie sie ihre Bandspeicherkapazitäten erhöhen, neue Systeme einführen und dabei aufbewahrungspflichtige Altdaten weiterhin nutzen können. Ein wesentlicher Aspekt bei der Bewältigung der Datenflut liegt jedoch auch in der Optimierung der Strukturen im Archiv; ist es doch Sinn und Zweck einer jeden Sicherung, Daten möglichst schnell, und vor allem zuverlässig, wiederherstellen zu können. Professionelle Dienstleister empfehlen, den Medienwechsel oder andere Aufräum-Aktionen zum Anlass zu nehmen, um mittels so genannter Tape-Stacking-Verfahren die bereits archivierten Daten zu konsolidieren. Auf das Bild des Kellers bezogen: grundlegend Ordnung zu schaffen, damit man in Zukunft gleich richtig wegräumen kann.

Um eine gezielte Analyse des Status Quo der Informationsbereitstellung und Archivierung kommt man dann nicht herum. Hier setzen professionelle Dienstleister an und offerieren ein in jahrelanger Praxis bewährtes Know-how. Was für die RZ-Verantwortlichen eine neue oder nur unregelmäßig wiederkehrende Aufgabe ist, stellt für die Experten der Beratungsabteilung nahezu Tagesgeschäft dar. Dementsprechend versiert analysieren, klassifizieren, strukturieren und sortieren sie. Am Ende einer solchen Analyse steht eine fundierte Beratung einschließlich Handlungsempfehlungen, die den Weg zu einem ordentlichen und auf stetes Wachstum angelegten Archiv ermöglicht. Diese Empfehlung umfasst nicht nur strategische Produktempfehlungen, sondern auch operative Handlungsempfehlungen wie die Wahl der geeigneten Verfahren für die Konsolidierung von Daten.

Tape-Stacking-Verfahren

Mittels so genannter Tape-Stacking-Verfahren werden Daten derart aufbereitet, dass sie sich optimal auf Band archivieren und vor allem schnell wiederherstellen lassen. Die Entscheidung, welches Verfahren das angemessene ist, stellt eine kleine Wissenschaft für sich dar und hängt von diversen Faktoren wie den zu speichernden Dateien und deren voraussichtlicher Größe ab.

After-the-fact-Stacking

After-the-fact-Stacking ist die traditionelle Methode. Sie eignet sich besonders für das Stacking von Dateien, deren gesamte Länge im Vorfeld der Produktion nicht zu bestimmen ist. Weiterhin eignet sich dieses Verfahren für nicht-katalogisierte Dateien, deren Länge man vor der Erstellung ebenfalls nicht kennt. After-the-fact-Stacking schreibt während der produktiven Stunden im Rechenzentrum die Daten kontinuierlich auf Scratch-Tapes. Dabei erhält jede Datei aufgrund der identischen Speicheradresse "Label 1" eine eigene Kassette. In den nicht-produktiven Stunden (in diesem Fall die Online-Stunden) schreibt das System die Dateien durch Umkopier- und Sortier-Prozesse konsolidiert auf die Bänder. Dieses Verfahren verarbeitet die Dateien also zweimal.

Diese Methode ist Mittel der Wahl beim Aufräumen existierender Datenbestände. Darüber hinaus kann man damit auch dem natürlichen Alterungsprozess der Bänder bei revisionsgerechter langfristiger Archivierung von Daten entgegenwirken. Zudem eignet es sich besonders für den Medienwechsel bei der Umstellung auf moderne Technologien und für Reorganisationsprozesse, da es problemlos auch bereits existierende Dateien behandelt.

[Schema After-the-fact-stacking]
After-the-fact-stacking eignet sich besonders für das Stacking nicht-katalogisierter Dateien oder andere Dateien, deren gesamte Länge im Vorfeld nicht bekannt ist.

DASD Spool Stacking

Diese Methode kann die Produktionszeit erheblich verringern. Während des Produktionsprozesses wird die so genannte Allokation der Datensätze unterbrochen, obwohl der Produktionsprozess weiterläuft. Die Dateien landen in einem Zwischenspeicher (Buffer) auf ein Festplattenlaufwerk. Sie bleiben so lange darin, bis die Kapazität des vorgesehenen Bandes ausgeschöpft ist. Erst nachdem das System die Dateien entsprechend der hinterlegten Dateikriterien sortiert und zu einer idealen Bandbelegung zusammengefasst hat, werden die Dateien auf Band übertragen.

Für dieses Verfahren eignen sich besonders Daten, die noch häufig im Produktionsprozess benötigt werden: Durch das Vorhalten für einige Stunden bis zu drei Tagen im Buffer entfällt ein zeitintensiver Zugriff auf die Bänder. Somit stehen die Dateien in dieser Zeit sehr schnell wieder im Produktionsprozess zur Verfügung. Auch lassen sich kleine Dateien, deren Größe im Vorfeld der Produktion aus Erfahrungswerten heraus bekannt ist, per DASD optimal auf Bänder verteilen. Weiterhin verspricht das Verfahren optimale Nutzung des ATL-Platz im Silo, ohne dass Datensätze zweimal bearbeitet werden müssten. So vermindert sich auch die mechanische Belastung der ATLs beziehungsweise Roboter, da die Anzahl der Zugriffe auf die Bänder sich erheblich reduziert.

[Schema DASD-Stacking]
DASD-Stacking verringert erheblich die Produktionszeit und eignet sich daher für im Produktionsprozess häufig benutzte Dateien.

Direct Stacking

Idealerweise kann man Direct Stacking einsetzen, wenn im laufenden Produktionsprozess genügend Zeitreserven zur Verfügung stehen, sodass kurzzeitige Unterbrechungen der Produktion keine drastische Auswirkung auf den gesamten Zeitrahmen haben. Auch bei dieser Methode unterbricht der Stacking-Prozess die Allokation während der Produktion. Das Tape-Stacking-Tool sucht in dieser Zeit das ideale Band, auf das es die anstehende Datei schreiben kann. Nach dem Finden und Bereitstellen des Bandes, geht der Produktionsprozess weiter.

Das Verfahren eignet sich besonders bei umfangreichen Dateien, deren Größe im Vorfeld der Produktion bekannt ist. Bei ihnen würde sich ein nachträgliches Stacking nicht lohnen, da dieses sehr zeitintensiv und somit nicht effizient ist.

[Schema Direct-Stacking]
Idealerweise nutzt man das Direct-Stacking für große Dateien, deren Umfang im Vorfeld der Produktion bekannt ist. Es eignet sich, wenn im laufenden Produktionsprozess genügend Zeitreserven zur Verfügung stehen.

Fazit

Die Zuordnung des optimalen Tape-Stacking-Verfahrens zu den unterschiedlichen Datentypen stellt nur einen Aspekt dar, der bei der Bandoptimierung zu berücksichtigen ist. Da die Organisation der Bandsicherung die Basis für eine dauerhafte Ordnung darstellt, lohnt sich die Überlegung, diese Dienstleistungen dauerhaft auszulagern.

Doch für welche – interne oder externe – Lösung sich ein Unternehmen auch entscheidet: Nur ein abgestimmtes und in sich stimmiges Tape-Stacking-Konzept gewährleistet, dass Dateien dauerhaft und vollständig auf das Medium Band gespeichert und dort revisionsgerecht archiviert werden können.

Stefan Hillenbach ist Business Development Manager Professional Services, Beta Systems Software AG.

© SecuMedia-Verlags-GmbH, D-55205 Ingelheim,
KES 2002/2, Seite 56