Systeme und ihr Umfeld

Ausweichrechenzentren

Mehr als MIPS

Von Jürgen Langner, München

Neben dem Bereitstellen von Backup-Kapazitäten für Computerkatastrophen nehmen Ausweichrechenzentren heutzutage zunehmend weitere Dienstleistungen in ihr Angebot auf. Bei der Auswahl des Notfall-Partners können diese Zusatz-Services durchaus ausschlaggebend sein.

Den Zusammenbruch von IT-Systemen kann man nie vollständig ausschließen. Ausweichrechenzentren und externe Datensicherung haben sich daher als wichtiger Bestandteil von IT-Sicherheitsstrategien etabliert und reduzieren die Gefahren auf ein Minimum. Von vielen IT-Verantwortlichen unbemerkt haben jedoch etliche Dienstleister ihre Service-Angebote rund um die Sicherheit noch ausgebaut. Mit der Absicherung von Call-Center-Plätzen oder dem Zugang zu branchenspezifischen Informationsdiensten erfüllen Ausweichrechenzentren teilweise auch sehr individuelle Anforderungen. Das Portfolio reicht zudem vom Televaulting über Web-Continuity-Services bis hin zum Load-Balancing.

Noch vor wenigen Jahren war das Kunden- und Leistungsspektrum von Sicherheitsdienstleistern für "Business Continuity" begrenzt. Nur wenige Unternehmen – vorrangig im Umfeld Banken und Versicherungen – mussten bei ihren IT-Systemen ein hohes Maß an Verfügbarkeit und Datensicherheit gewährleisten. Die IT-Systeme waren zumeist homogen aufgebaut. Hardware-Defekte und äußere Einwirkungen wie Feuer und Stromausfälle waren die häufigsten Fehlerquellen.

Heute haben moderne IT- und Telekommunikationssysteme alle Wirtschaftszweige durchdrungen. Heterogene Netzwerkstrukturen, das Internet und rasant steigende Datenmengen haben das Bild entscheidend verändert. In allen Branchen müssen Unternehmen Systeme und Daten professionell sichern, weil ein Zusammenbruch weitreichende Umsatzverluste und Kosten nach sich zöge. Vorstände und IT-Verantwortliche müssen diese Risiken ernst nehmen: Sie sind hierzulande gesetzlich zur Risikovorsorge verpflichtet und können von Aktionären und Geldgebern haftbar gemacht werden. Gleichzeitig haben sich die Bedrohungsszenarien verändert: Die Offenheit und wachsende Vernetzung der Systeme machen Bedienfehler des eigenen Personals, Probleme bei Updates und Software-Umstellungen zu Ursachen für eine steigende Anzahl an IT-Ausfällen; hinzu kommt eine steigende Zahl von Viren- und Denial-of-Service-Attacken.

Auswahlkriterien

Es ist daher weniger eine Frage, ob ein Unternehmen seine vitalen Geschäftsprozesse gegen Systemausfälle sichern und einen schnellen Wiederanlauf garantieren sollte. Meist bietet ein Outsourcing von Desaster-Recovery- und Business-Continuity-Leistungen an einen Spezial-Anbieter einen besseren Schutz zu deutlich geringeren Kosten als eine eigene Lösung. Bleibt die Frage, wie man den richtigen Sicherheitsdienstleister auswählt.

Im Mittelpunkt sollte dabei stets die Leistungsfähigkeit des Anbieters im Kernbereich Business Continuity stehen. Dabei gilt es neben der reinen Rechenleistung auch auf die entsprechende Peripherie, beipielsweise Druckerkapazitäten und eine ausreichende Netzanbindung, zu achten. Immer wichtiger werden jedoch auch Zusatzleistungen, die Risikofaktoren bereits im Vorfeld reduzieren. Durch die Kombination von Leistungen können Unternehmen oft wesentlich günstigere Kosten/Nutzen-Verhältnisse für das Gesamtpaket der bezogenen Sicherheitsdienstleistung erzielen.

Beratung/Konzeption

Unternehmen sollten unbedingt auf eine umfassende Beratung und ein schriftliches Konzept bestehen – und zwar vor dem Abschluss eines Dienstleistungsvertrags. Erteilen Sie für Konzept und Dienstleistung getrennte Aufträge. Das erstellte Konzept sollte in jedem Fall eine umfangreiche Bestandsaufnahme und Risiko-Analyse enthalten und alle bestehenden Systeme und Applikationen gestaffelt nach möglicher Schadenshöhe priorisieren. Wichtig: Um einen realistischen Schadensumfang zu ermitteln, sind hier indirekte Folgeschäden unbedingt einzuschließen. In der Business-Impact-Analyse sollten alle denkbaren Ausfallszenarien und ihre Auswirkungen nicht nur beschrieben, sondern darüber hinaus klar und eindeutig quantifiziert werden. Nur so lassen sich die Kosten und Nutzen der Dienstleistungen einer Sicherheitsstrategie gegenüberstellen und auch komplexe technische Konzepte gegenüber Controllern und Betriebswirten darstellen.

Lassen Sie sich Vorschläge unterbreiten, wie Risiken bereits im Vorfeld minimiert werden können. Dies können beispielsweise Veränderungen der Netzwerkstrukturen oder Anpassungen der internen Backup-Strategie sein. Darauf aufbauend können verschiedene Service-Level für unterschiedliche wichtige Systeme vereinbart werden – mit erheblichen Auswirkungen auf den Preis der Dienstleistung. Im Mittelpunkt aller Überlegungen sollten naturgemäß jene Systeme und Applikationen stehen, die für die Fortführung des operativen Geschäftes existenziell sind.

Die Analyse und Konzeption kann nur einen gewissen Zeitraum abdecken. IT-Systeme, Risikopotenzial und die Bedeutung von Applikationen für den Unternehmenserfolg wandeln sich schnell. Viele Sicherheitsdienstleister bieten deshalb regelmäßige Überarbeitungen der Sicherheitskonzeptionen an.

Rechnerplattformen

Achten Sie darauf, dass im Ausweichrechenzentrum eine breite Palette an Rechnersystemen zur Verfügung steht. Dies garantiert, dass bei einem Ausfall die notwendigen Kapazitäten zur Verfügung stehen und der Dienstleister im Zweifelsfall auch zwei oder drei parallele Notfälle bei seinen Kunden bewältigen kann – ein Szenario, das bei Viren-Attacken nicht unwahrscheinlich ist.

[Foto: KES Archiv, restart]
Auch Mainframes gibts heute portabel (hier: Fujitsu Siemens SR 2000 bei Restart, Hannover).

Natürlich gilt, dass das Ausweichrechenzentrum insbesondere über diejenigen Plattformen verfügen muss, die der Kunde nutzt. Lassen Sie sich möglichst zusichern, dass der Dienstleister seine Systeme erweitert oder erneuert, wenn Sie das in Ihrem Unternehmen tun. Verfügt der Dienstleister darüber hinaus über Systeme anderer Plattformen, ist sichergestellt, dass man als Kunde auch bei einem Plattformwechsel einen kompetenten Partner hat.

Wiederanlaufzeit

In den meisten Fällen gilt: Je kürzer die Ausfallzeit der Systeme, desto geringer die Schäden. Definieren Sie mit dem Sicherheitsdienstleister Service-Level, die unabhängig von der Schadensursache die maximale Zeit vom Zusammenbruch bis zum Wiederanlauf der Systeme definieren. Grundmaßstab ist dabei stets die vom Unternehmen maximal tolerierbare Ausfallzeit. Hier müssen eindeutige Prioritäten gesetzt, aber auch Ketteneffekte einbezogen werden. So nützt beispielsweise eine Wiederanlaufzeit von maximal 2 Stunden bei einer PC-gestützten Call-Center-Auftragsannahme wenig, wenn nicht gleichzeitig genügend Telekommunikationseinrichtungen im Ausweichrechenzentrum zur Verfügung stehen.

Einbindung von TK-Anlagen und Front-Office-Arbeitsplätzen

In allen kunden- und service-orientierten Geschäftsmodellen spielt das Front-Office heute eine besondere Rolle. Derartige Unternehmen sollten bei ihrem Dienstleister auch komplett eingerichtete Ausweicharbeitsplätze mit allen notwendigen Kommunikationseinrichtungen vorfinden. Achten Sie dabei auf Branchenkenntnisse. Leistungsfähige Sicherheitsdienstleister können durchaus gewährleisten, dass beispielsweise der Händlerraum einer Investmentbank binnen zwei Stunden komplett zu verlagern ist. Nach dieser Zeit sollten die Mitarbeiter unter ihren bekannten Telefondurchwahlen im Ausweichrechenzentrum erreichbar sein und über ihre gewohnten Kommunikationsmöglichkeiten und alle branchenspezifischen Informationsdienste verfügen.

[Foto: Guardian iT]
Neben Ausweich-Rechnerleistung benötigen viele Unternehmen heute auch Ausweicharbeitsplätze für die Telekommunikation (hier: Guardian iT, London).

Relocatable Services

In vielen Fällen kann der schnellste Wiederanlauf durch ein Verbringen kompletter Ersatzsysteme (Rechner, Hubs, Router und Speichersysteme) vom Dienstleister zum Kunden garantiert werden.

Tests/Schulungen/Notfallpläne

Die Erfahrung mit IT-Zusammenbrüchen zeigt: Der entscheidende Faktor ist der Mensch. Der beste Notfallplan nutzt nichts, wenn das Personal panisch reagiert. Notfallpläne sollten daher unbedingt mit klaren Handlungsanweisungen ausgearbeitet, schriftlich fixiert und geschult werden. Bestehen Sie auf regelmäßigen Tests, bei denen mit Ihrem Personal Zusammenbrüche simuliert und Notfallprozesse trainiert werden. Im Ausweichrechenzentrum sollten hierzu Systeme zur Verfügung stehen, auf denen Zusammenbrüche real ausgelöst und der Wiederanlauf mit Ihrem aktuellen Datenbestand durchgeführt werden kann.

Nur durch solche Tests lässt sich ohne Betriebsunterbrechung im Unternehmen feststellen, ob die vereinbarten Sicherheitsstrategien praktikabel sind. Sicherheitsdienstleister, die ihre Aufgabe Ernst nehmen, üben häufig sogar sanften Druck auf ihre Kunden aus, diese Übungen regelmäßig durchzuführen. Ein Kontingent an Test-Tagen ist dann oft im Preis enthalten, damit der Kunde bei knapper werdenden Budgets nicht an dieser wichtigen Stelle spart und aus kurzfristigem Kostendenken die Sicherheitsstrategie vernachlässigt.

Zusatzdienste

Sicherheitsdienstleister bündeln in ihren Ausweichrechenzentren ein großes Potenzial an Fachwissen und leistungsfähigen IT-Systemen. Da liegt es nahe, diese Ressourcen auch außerhalb von IT-Katastrophenfällen zu nutzen und damit indirekt die Kosten für das Vorhalten von Ressourcen und Systemen zu senken. Viele Anbieter von Ausweichrechenzentren haben daher in den letzten Jahren ihr Leistungsspektrum rund um das Thema Sicherheit kontinuierlich ausgebaut.

Hochverfügbarkeitssysteme

Für einige Plattformen existieren spezielle Software-Pakete und Systemlösungen, die alle Transaktionen innerhalb einer Anwendung sofort per Hochgeschwindigkeitsverbindung auf ein Backup-System im Ausweichrechenzentrum übertragen. Ein Beispiel dafür ist die MIMIX-Software. Hier wird auf dem Backup-System eine 1:1-Kopie des aktuellen Datenbestandes geführt. Kommt es zu Störungen beim Kunden, kann das Backup-System im Ausweichrechenzentrum ohne Zeitverzögerung sofort die Arbeit aufnehmen.

Mit der Implementierung von Hochverfügbarkeitssystemen gehen neben einer Erhöhung der Sicherheit auch erhebliche Effizienzsteigerungen einher. Das Kundensystem kann sehr viel länger produktiv eingesetzt werden. So lassen sich beispielsweise Backups auf das System im Ausweichrechenzentrum verlagern, sodass die Leistungsfähigkeit des Kundensystems von Backup-Fenstern unbeeinträchtigt bleibt. Auch umfangreiche Management-Auswertungen, für die ebenfalls Kapazitäten von den produktiven Anwendungen abgezweigt werden müssten, lassen sich auf dem externen System fahren. In einigen Fällen werden Backup-Systeme auch für die Installation von Upgrades genutzt: Die Administratoren installieren sie zunächst im Ausweichrechenzentrum und können intensiv testen. Erst anschließend überspielt man das "runderneuerte" System auf die produktive Anlage beim Kunden. Der Zeitaufwand im eigenen Unternehmen ist dadurch begrenzter und lässt sich wesentlich besser kalkulieren.

[Foto: KES-Archiv, Guardian iT]
"Heiße" Lösungen, die mit ständig gespiegelten Daten sofort einspringen, werden immer wichtiger (hier: Backup-System für Kühne & Nagel bei Guardian iT, München)

Remote-Festplattenspiegelungen

Eine anwendungsunabhängige Variante dieses Verfahrens ist die Remote-Festplattenspiegelung. Hier werden die Daten in Echtzeit über ein Hochgeschwindigkeitsnetzwerk auf Festplattenfarmen im Ausweichrechenzentrum kopiert.

Televaulting

Bei dieser Form des externen Backups werden Daten in regelmäßigen Abständen per Datenleitung auf Systeme im Ausweichrechenzentrum übertragen. Diese Backups laufen komplett automatisiert. Im Bedarfsfall überspielt das Ausweichrechenzentrum die Daten zurück zum Kundensystem.

Bei allen Datensicherungs-Verfahren sollte es selbstverständlich sein, dass die genutzten Hochgeschwindigkeitsverbindungen speziell abgeschirmt und die Daten bei der Übertragung und eventuell auch bei der Speicherung zusätzlich verschlüsselt werden.

Test der Datenintegrität

Bei Analysen der Qualität von Standard-Backup-Verfahren bei Kunden durch Guardian iT zeigte sich, dass ein erschreckend großer Teil der Backups auf Datenträgern im Notfall nicht nutzbar ist. Nicht-integre Daten und technische Übertragungsfehler führen zu dem ernüchternden Ergebnis, dass etwa 30 % der Backups überhaupt nicht und weitere 40 % der Backups nur teilweise nutzbar wären.

Hilfreich ist es, wenn Sicherheitsdienstleister spezielle Analysen der Datenintegrität anbieten. Erfasst werden dabei Datenfehler sowie Backup- und Restore-Zeiten auf Anwendungsebene, damit Kunden Backup-Strategien und -Prozesse kontrollieren und optimieren können.

E-Business Consulting

Besonders bei Online- und Web-Applikationen wird oft viel Geld und Arbeit in schnelle Lade- und Response-Zeiten beim Endanwender investiert. Aber was nützt ein optimierter Bildschirmaufbau, wenn der Server oft stundenlang zusammenbricht und nicht erreichbar ist?

Im Rahmen eines Sicherheits-Consultings können Unternehmen bei manchen Dienstleistern die Zuverlässigkeit und Belastbarkeit ihrer E-Commerce-Applikationen und Web-Server testen lassen. Dabei gilt ein Hauptaugenmerk den Belastungsgrenzen bei den Zugriffszahlen und der Anfälligkeit gegenüber internen und externen Attacken. Diese und andere Risikofaktoren können beispielsweise im Ausweichrechenzentrum ohne Störung des Realbetriebs simuliert, Gegenmaßnahmen getestet werden.

Co-Location/Web-Hosting

Einige Unternehmen haben aus der Not eine Tugend gemacht und übertragen ihre Web-Services komplett in Ausweichrechenzentren. Dies bietet sich besonders dort an, wo E-Commerce nur einen Teilbereich des Unternehmens darstellt und ein Unternehmen im B2B-Sektor eine besonders hohe Zuverlässigkeit seiner Web-Applikation sicherstellen will.

Load Balancing

Eine – auch aus wirtschaftlichen Gesichtspunkten – sehr interessante Kombination aus Outsourcing- und Inhouse-Betrieb stellt das Load Balancing zwischen Produktiv- und Ausweichsystem dar. Hierfür wird im Rechenzentrum ein dediziertes Kundensystem installiert. Es dient zum einen als sofort einsatzbereites Backup-System im Notfall. Gleichzeitig kann es bei Belastungsspitzen aber auch zusätzliche, sofort verfügbare Kapazitäten liefern. Besonders für schnell wachsende Unternehmen oder bei IT-Anwendungen mit hohen Belastungsfluktuationen kann dies eine kostengünstige Lösung sein. Der Kunde spart Geld, da er mit seinen Inhouse-Systemen eng an der Kapazitätsgrenze fahren kann. Der für die Zuverlässigkeit notwendige System-Overhead mit Leistungsreserve steht dann im Ausweichrechenzentrum. Erst wenn die Kapazität dauerhaft über der Leistungsfähigkeit der internen Systeme liegt, erwirbt man ein zusätzliches System.

Fazit

Hauptkriterien für die Auswahl eines Sicherheitsdienstleisters sollten dessen Fähigkeiten und Kompetenzen für einen möglichst schnellen Wiederanlauf aller relevanten Systeme bleiben – unabhängig von der Schadensursache. Ist dies durch ausreichend definierte und getestete Service-Level gewährleistet, empfiehlt sich ein prüfender Blick auf die angebotenen Zusatzleistungen. Unternehmen, die Business Continuity Services mit einigen der neuen Dienstleistungsangebote kombinieren, können die Kosten für die Summe der Leistungen teilweise drastisch reduzieren. Grund hierfür ist, dass viele der Einrichtungsarbeiten und technischen Vorkehrungen für alle angebotenen Dienstleistungen identisch sind und deren Kosten bei Leistungskombinationen nur einmal anfallen.

Stehen beispielsweise im Ausweichrechenzentrum dedizierte Systeme für den Notfall bereit, so kann man sie recht leicht auch bei Kapazitätsengpässen einsetzen. Die konkreten Einsparungen durch solche Kombinationen lassen sich naturgemäß nur im Einzelfall abschätzen. Bei steigenden Sicherheits- und Verfügbarkeitsanforderungen und gleichzeitig sinkenden Budgets und quälendem Personal- und Qualifikationsmangel dürfte sich die Partnerschaft mit einem Sicherheitsdienstleister für viele IT-Verantwortliche und Unternehmen lohnen.

Jürgen Langner ist Marketing Manager der [externer Link] Guardian iT GmbH.

© SecuMedia-Verlags-GmbH, D-55205 Ingelheim,
KES 4/2001, Seite 32