[ Aufmachergrafik ] K-Fall-Vorsorge heute: Schnell, günstig, integral

Ordnungsmerkmale

erschienen in: <kes> 2003#3, Seite 12

Rubrik: Management und Wissen

Schlagwort: Business Continuity

Schlagwort-2: Ausweichkapazität

Zusammenfassung: Was tut sich im Markt in Sachen Business Continuity? Die <kes> hat sich bei Anbietern von Ausweichkapazitäten nach Angebot, Nachfrage und aktuellen Trends erkundigt.

Früher war alles einfacher. Da war "geschäftskritische Informationstechnik" gleichbedeutend mit "Großrechner" und der stand in einer gut gesicherten Maschinenhalle. Für den Fall des Ausfalls musste es irgendwo eine Ausweichkapazität geben, die dann mit den – möglicherweise ausgelagerten – Backup-Daten beschickt wurde. Punkt. Heute sind die Anforderungen in jeder Hinsicht explodiert: kaum tolerable Downtime, heterogene Rechnerparks mit etlichen wichtigen Servern und Applikationen, Vernetzung mit Hochverfügbarkeitsanspruch und nicht zuletzt auch eine gewachsene Bedeutung der Telefonie (s. a. S. 16).

Bereits als die <kes> vor zwei Jahren zuletzt eine Marktübersicht der Anbieter von Ausweichkapazitäten erstellt hat [1], war deren Angebot [2] entsprechend umfangreich und vielfältig: Es gibt eigentlich nichts, das nicht zu haben ist, vom transportablen Mainframe in der Kiste bis zum gespiegelten Produktivsystem mit Load-Balancing, von der TK-Zentrale im Container bis zum Ausweichbüro für hunderte Mitarbeiter. Das galt bereits vor dem Anschlag auf die Zwillingstürme des World Trade Center, der nicht nur terroristisch, sondern auch für die New Yorker IT-Landschaft einen Super-GAU dargestellt hat.

Womöglich am stärksten gewandelt hat sich seither das Bewusstsein der Chefetagen. Matthias Kirstein, Senior-Consultant bei MDH, berichtet: "Notfallvorsorge genießt seit dem 11. September 2001 eine deutlich höhere Aufmerksamkeit, besonders bei Unternehmen mit englischem und amerikanischen Management oder Kapital. Aber auch ganz allgemein hat sich die Entscheidungsfindung bei den interessierten Unternehmen beschleunigt: Sind in den späten 90ern von der Erst-Information bis zur Entscheidung im Schnitt 12–18 Monate vergangen, so hat sich dieser Prozess deutlich verkürzt. Entscheidungen fallen heute teilweise schon nach 3–6 Monaten."

Dennis Thomas von Synstar bestätigt diesen Eindruck: "Seit dem 11. September stellen wir fest, dass man sich in den Unternehmen und vor allem in den Vorständen mehr Gedanken um die Absicherung der IT-gestützten Geschäftsprozesse macht und damit eine Kultur höheren Risikobewusstseins entsteht. Ganz deutlich wurde dies auch kürzlich, als wir anlässlich der Eröffnung unseres neuen Business Recovery Centers in Darmstadt 70 Unternehmensvertreter zu Gast hatten; vor zwei Jahren wären es höchstens 20 gewesen." Förderlich für diese Entwicklung seien auch gesetzliche Anforderungen und die Kreditvergaberichtlinie BASEL II [3].

Seitens der IBM Business Continuity & Recovery Services gibt Günther Langen dabei zu bedenken: "Gegenwärtig ist Basel II zwar in aller Munde und in der Presse präsent. Es ist aber zu bemerken, dass sich viele Unternehmen der Tragweite von Basel II gerade in Bezug auf eine sichere IT noch gar nicht voll bewusst sind." Überdies habe der 11. September auch gezeigt, dass IT-Ressourcen in ausreichendem Umfang vorhanden waren: "Hier hat sich ein neuer Gesichtspunkt eröffnet: das Fehlen von Arbeitsplätzen. Die Anforderungen an das Workplace Recovery sind seitdem deutlich gestiegen."

Einen zusätzlichen Einfluss sieht Harald Stamm, Marketingleiter HP Managed Services, auch durch die mittlerweile jährlich auftretenden Hochwasser: "Angesichts all dieser Dinge scheint in den deutschen Unternehmen die Sensibilisierung, was das Thema Business Continuity betrifft, stetig wenn auch langsam zu wachsen. Allerdings haben immer noch aktuelle IT-Projekte in der Priorität und somit auch im Budget Vorrang vor Maßnahmen zur Absicherung der kritischen Unternehmensprozesse. Insgesamt ist der deutsche Markt eher stagnierend beziehungsweise wächst sehr langsam im Bereich Business Continuity Services. Die wirtschaftliche Situation schlägt sich auch in der verstärkten Nachfrage nach Ausweichrechenzentrumsfläche nieder, teilweise verbunden mit Recovery-Office-Lösungen. Offensichtlich sind die Unternehmen eher an kostenflexiblen Lösungen interessiert als an kapitalbindenden Eigeninvestitionen, die Fixkosten verursachen."

Kostendruck

Andere Auswirkungen des Sparkurses kennt Friedrich K. Abraham von atsec: "Die Übernahme der Aufgaben ausgefallener Ressourcen durch andere Systeme setzt Clustering voraus. Freie Ressourcen sind aber in der Folge der Mittelknappheit für IT-Systeme rar. Eine vorübergehende Stilllegung weniger wichtiger Applikationen kann jedoch eventuell solche Ressourcen schaffen. Zudem lassen sich Vorsorgekosten im Prinzip auch mit Partnerunternehmen teilen. Die gemeinsame Bevorratung von Ersatzsystemen setzt freilich ein hohes Maß an Kompatibilität und Synchronisation von Entwicklungsprozessen voraus." Abraham warnt allerdings ohnehin davor anzunehmen, dass die maximale Ausfallzeit mit dem Vorsorgeaufwand linear sinkt: "Meist trifft das nicht zu. Angesichts der Unwahrscheinlichkeit großer Störungen kann auch eine Restrisikoübertragung, etwa auf eine Versicherung, eine interessante Alternative sein."

Auch MDH konstatiert "ein stärkeres Preisbewusstsein und damit einen Trend hin zu Lowcost-Lösungen". Laut Matthias Kirstein werden beispielsweise Daten häufig unternehmensintern in einem zweiten Raum gespiegelt, um die Restorezeit zu minimieren und die Daten ständig aktuell verfügbar zu halten: "Durch Service-Unternehmen wird dann nur noch Rechnerkapazität für den Bedarfsfall bereitgestellt. So ist zu akzeptablen Preisen ein Wiederanlauf innerhalb weniger Stunden gewährleistet." Wer mehr Zeit hat, kann natürlich auch noch mehr sparen: "Ausführliche User-Befragungen, insbesondere im Mittelstand, haben ergeben, dass mit einem detaillierten und aktuellen Notfallhandbuch und Eskalationsplan ein Ausfall von bis zu zwei Werktagen durchaus tolerierbar und kompensierbar ist."

Hohe Kosten für die erforderlichen Leitungsanbindungen sorgen laut Karl Schaller von Restart auch dafür, dass Mirroring-Lösungen heute nur im Ausnahmefall zur externen Spiegelung dienen. Mit sinkenden Leitungskosten sei hier eine Trendwende zu erwarten. Heute steht jedoch noch immer die Magnetbandkassette (MBK) im Mittelpunkt der Katastrophensicherung: "Mirroring dient in der Regel nur 'inhouse' der Vorsorge für den technischen Ausfall." Und trotz ausgereifter MBK-Technik gibt es Schwierigkeiten aufgrund der stark gestiegenen Komplexität der Anwender-Systeme und mangelndem Know-how: "Restart hat bei Recovery-Tests häufig Fehler in den Datensicherungen festgestellt. Zum Teil waren sie so gravierend, dass sie die Existenz des Unternehmens bedroht hätten," berichtet Schaller.

Ein "signifikantes Fehlschlagsrisiko beim Full Recovery" sieht auch Friedrich Abraham (atsec): "Datenspiegelung ist bezogen auf Disaster-Recovery-Szenarien dem traditionellen Backup vorzuziehen, sobald die Datenmenge ein kritisches Volumen erreicht, auch weil ein Wiederanlauf ansonsten schlicht zu lange dauert. Für die alltäglichen Störungen wie das versehentliche Löschen von Daten bleibt das Backup aber unverzichtbar." Im letzten Punkt ist sich die Branche einig. Und letztlich bestimmt das Verfügbarkeitsziel die Methodik. Matthias Rosenberg von Controll-IT: "Im industriellen Umfeld sind Hochverfügbarkeitslösungen weniger verbreitet, die datenträgerbasierte Lösung hat dort eine größere Bedeutung. Die Finanzdienstleistungsbranche setzt hingegen mit großer Durchdringung Hochverfügbarkeitslösungen sowohl für Systeme als auch für Daten ein."

[Illustration - Quelle: IBM]
Zwei wesentliche Steuergrößen für die Auswahl von Disaster-Recovery-Lösungen sind die maximale Wiederanlaufzeit (Recovery Time Objective, RTO) und die erforderliche Datenaktualität (Recovery Point Objective, RPO).

Heiß und kalt

Mehrere Anbieter sehen bereits jetzt einen allgemeinen Trend zu "heißeren" Lösungen: "Die Bereitschaft zu Spiegel- und Clusterlösungen hat sich erheblich erhöht und dieser Trend wird sich weiter verstärken. Inzwischen sehen immer mehr Interessenten und Kunden das Ausweichrechenzentrum des Dienstleisters als zweiten Produktionsstandort an. Sie vereinbaren zusätzlich Managementleistungen für den laufenden Betrieb und nicht nur – wie in der Vergangenheit – ausschließlich für den Notfall", so Martin Pollehn von der INFO AG.

Albert Hold resümiert für die T-Systems International GmbH: "In den letzten zwei Jahren hat sich eine Wende von traditionellen Services für den Katastrophenfall hin zu IT- und gebäudetechnischen Konzepten vollzogen. Je nach Service-Anforderungen werden dabei Local- oder Remote-Sister-Site-Lösungen in Cluster-Technik eingesetzt, die gemeinsam produktiv arbeiten. In diesem Umfeld spielen die neuen Möglichkeiten des Geographically Dispersed Parallel Sysplex (GDPS) von Mainframe-Systemen eine entscheidende Rolle. Eine Verdopplung der Nachfrage haben wir zudem bei Business Continuity Service Consulting erfahren." Während die traditionellen Offline-Services leicht rückläufig sind, sieht Hold zudem für ausgewählte Systeme eine starke Zunahme von Lösungen mit periodischer Datenspiegelung (mit Hardware-Sharing). Nur geringe oder gar keine Nachfrage bestehe hingegen für synchron gespiegelte Daten ohne ständigen Produktiveinsatz.

Einen Trend zur starken Verkürzung der Datenverlust- und Wiederanlauf-Fristen sieht auch Dennis Thomas (Synstar): "Der Support muss dabei rund um die Infrastruktur komplett sein: nicht nur Rechner- und Plattenkapazitäten, sondern auch Telekommunikationsverbindungen bis hin zu Telefonarbeitsplätzen mit Call-Center-Funktionen – eventuell in mobilen Containern zur ersten Notfallversorgung auf dem Parkplatz. Der Trend geht zu Komplettlösungen rund um die Verfügbarkeit." Günther Langen (IBM) sieht bei der Absicherung von TK-Anlagen und auch Druck-Ressourcen jedoch verbreitet Mankos: "Obwohl dies essenzielle Bestandteile im gesamten Räderwerk der Geschäftsprozesse sind, werden sie immer noch stiefmütterlich behandelt." Oft höre man dann die Bemerkung "Oh je, das haben wir ja gar nicht berücksichtigt!"

Komplettlösungen

Die Abbildung vollständiger Geschäftsprozesse nennt auch Restart im Business Recovery als entscheidend: "Dazu werden Server, Arbeitsplätze, Telekommunikationseinrichtungen und Systeme für die Druck- und Nachverarbeitung benötigt, und zwar mit Hochsicherheitsumgebung – man denke an sensitive Druckdaten wie Depotauszüge – und mit ausreichender Fläche für die Lagerhaltung von Formularen und Druckoutput."

"Realisierte Disaster-Recovery-Lösungen werden in zunehmendem Maße in die Unternehmensprozesse integriert", beobachtet Martin Pollehn (INFO AG). "Zumeist ist daher auch die Absicherung von Arbeitsplätzen Bestandteil einer Business-Continuity-Lösung. An der Absicherung von TK-Anlagen besteht zwar relativ großes Interesse, die Umsetzung im Notfallvorsorgeprojekt erfolgt allerdings noch selten, wenngleich mit steigender Tendenz." Matthias Rosenberg (Controll-IT) bemerkt auch hier einen Sparkurs: "Bei Backup für TK-Anlagen und Arbeitsplätze geht der Trend zu kostengünstigen Eigenlösungen. Es werden zunehmend weniger Dienstleister in Anspruch genommen." Eine Zukunftsaussicht für die Telekommunikation könnten dabei zudem Voice-over-IP-Systeme bilden.

----------Anfang Textkasten----------

Business Continuity Institute

Seit Anfang 2003 ist das Business Continuity Institute (BCI, www.thebci.org) als Berufsverband auch in Deutschland als Verein organisiert; sein Ziel lautet "Entwicklung und Pflege des betrieblichen Kontinuitätsmanagements (BKM) als Fachdisziplin". Das BCI wurde 1994 in Großbritannien als Interessengemeinschaft und -vertretung aller mit dem Business Continuity Management befassten Spezialisten gegründet und ist derzeit international in 39 Ländern mit rund 1 300 Mitgliedern aktiv. Deutschland ist übrigens eines der ersten (nicht-angelsächsischen) Länder, in denen sich ein eigenes Business-Continuity-Forum gebildet hat (www.bciforum.org). Es soll Unterstützung und Fortbildungsmöglichkeiten für den Praktiker bieten. Das BCI hat übrigens zehn Kernkompetenzen für die Zertifizierung entwickelt, welche die Fähigkeiten beschreiben, die ein BCM-Experte mitbringen sollte, um das Management der betrieblichen Kontinuität durchgehend und kompetent zu gestalten.

----------Ende Textkasten----------

Zusammenfassend lässt sich mahnend feststellen, dass Business Continuity heute keinesfalls durch Absicherung einiger essenzieller Systeme gewährleistet wird. Vielmehr sind Ausweichkapazitäten für komplette Geschäftsprozesse vorzusehen; die genaue Art hängt nicht zuletzt von den Verfügbarkeitszielen ab. Angesichts knapper werdender Zeitfenster scheint aber ein Trend zu "heißen" Lösungen erkennbar zu sein, die außer zum Risikoschutz möglichst auch zur Lastverteilung im Produktivbetrieb mitlaufen. Das klassische Backup darf man dafür jedoch nicht opfern, sonst fehlt die Möglichkeit zum Rückgriff auf schlicht versehentlich gelöschte oder schleichend korrumpierte Daten. Und nie vergessen: Jedes Recovery-Konzept muss sich inklusive Personal in praktischen Übungen regelmäßig als funktionsfähig erweisen.

Literatur

[1]
Marktübersicht Ausweichrechenzentren, <kes> 2001#4, S. 36
[2]
Jürgen Langner, Mehr als MIPS, <kes> 2001#4, S. 32
[3]
Markus Schäffter, IT-Entscheider in der Verantwortung, <kes> 2002#4, S. 10