Alle Jahre wieder – kommt der DR-Test

Die Zeit zwischen Weihnachten und Neujahr ist für manche IT-Manager die stressigste Zeit des Jahres. Sie müssen in der Zeit zwischen den Jahren den jährlichen DR-Test machen, während der Rest des Unternehmens frei hat. Von Johan van den Boogaart, Zerto, habe ich ein paar Zeilen zu diesem Thema erhalten, die ich hier einstelle.


Anzeige

Möglicherweise ist der DR-Test bei dem einen oder anderen Admin, der hier mitliest, längst gelaufen. Für einige in der Organisation gilt: Die Zeit zwischen den Jahren wird von IT-Administratoren genutzt, um die die notwendigen jährlichen DR-Tests durchzuführen.

Anmerkung: Das Kürzel DR steht für Disaster Recovery und der DR-Test dient zur Überprüfung der Notfallpläne bei einem Ausfall eines Systems (siehe auch).

Unternehmen müssen den DR-Test durchführen, um eine konstante Verfügbarkeit und die Einhaltung der geltenden Gesetze mit ihren IT-Systemen zu gewährleisten.

Stecker ziehen und sehen, was passiert

In der Theorie ist DR-Testing tatsächlich sehr einfach – Man zieht den Stecker und startet die Stoppuhr.

DR-Test
(Quelle: Zerto)

In der Praxis scheint das Vertrauen der meisten IT-Manager in ihr System, trotz der enormen Summen die sie gekostet haben, nicht sehr hoch zu sein. Niemand der seine fünf Sinne beisammen hat, würde an einem funktionierenden System einfach den Stecker ziehen – obwohl man sehr viel Geld dafür bezahlt hat, damit man genau das tun kann könnte.

Insbesondere bei sehr großen Organisationen mit hohem Datenbestand kann es fast unmöglich sein einen DR-Test durchzuführen. Allein die Planung kann mehrere Tage Vorbereitung benötigen, weil verschieden IT-Abteilungen involviert sind, die alle zur selben Zeit bereit sein müssen.

Und die einzige Zeit im Jahr, zu der große Unternehmen tatsächlich einen DR-Test durchführen können, ist zwischen Weihnachten und Neujahr, damit man das System im Notfall noch richten könnte, falls tatsächlich etwas schief geht.

Man hat schon von Fällen gehört, dass diese Großunternehmen einen DR-Test sogar innerhalb von acht Tagen nicht erfolgreich abschließen konnten, weil die Menge an zu bewegenden Daten einfach zu groß war um den Test zu einhundert Prozent sicher zu gestalten.


Anzeige

Was jedoch sagt dies über die Compliance dieser Organisationen aus, wenn man in der Realität unfähig ist einen DR-Test durchzuführen? Gesetzliche Vorgaben, wie etwa in Deutschland das Bundesdatenschutzgesetz (BDSG), legen fest, dass „Es sichergestellt werden muss, dass personenbezogene Daten gegen zufällige Zerstörung oder Verlust geschützt werden."

Diese Anforderung wird durch die sogenannten „8 Gebote der Datensicherheit" spezifiziert. Dort ist unter dem Punkt „Verfügbarkeitskontrolle" geregelt, dass als Maßnahme dafür ein  geeignetes und funktionierendes Disaster- bzw. Backup-Konzepts vorgesehen ist.

Die Realität sieht für die meisten Organisationen ganz anders aus, was im Umkehrschluss bedeutet, daß die meisten Organisationen trotz teurer Systeme die gesetzlichen Vorgaben nicht erfüllen. Zum Kreis dieser Organisationen zählen laut Industrieexperten durchaus auch sehr große und bekannte Unternehmen aus der Medizin, dem Finanz- und Versicherungswesen.

Vorsatz für das neue Jahr: Den genauen RTO herausfinden!

Bei einem so wichtigen Job und Systemen, die mit riesigen Budgets gekauft wurden, stellt sich die entscheidende Frage, wie sicher das System in der Realität ist: Was genau ist der RTO? Ein IT-Manager, dessen Aufgabe es ist, jederzeit und um jeden Preis die Verfügbarkeit zu gewährleisten, sollte in der Lage sein, die Antwort zu geben.

Nun, in Wirklichkeit funktioniert nicht so einfach. Selbst mit den fortschrittlichsten und teuersten Speichersystemen, basierend auf Stretched-Cluster-Technologie und veralteter BC/DR-Strategie, sind die meisten IT-Administratoren nur in der Lage, die RTO ihres Systems bei einem Hardwarefehler anzugeben. Müssen Snapshots zurükgespielt, Backups wiederhergestellt oder Applikationen konsistent gemacht werden, so kann ein RTO im besten Fall grob geschätzt werden.

Natürlich konnte die genaue RTO durch einen ordnungsgemäßen DR-Test ermittelt werden, der regelmäßig durchgeführt werden sollte, um zu zeigen, dass das System funktioniert und für eine mögliche Katastrophe in der realen Welt gerüstet ist.

DR-Tests mit wenigen Klicks: Hypervisor-basiertes CDP

Um diese kritischen Mängel des aktuellen Standards von DR-Strategien zu beheben, müssen Unternehmen die grundlegende Tatsache verstehen, dass ihre hardwarebasierte Strategie mit Snapshot-Technologie für ein physisches Rechenzentrum entwickelt wurde und nicht den Anforderungen der neuen virtualisierten Welt entspricht.

Der nächste logische Schritt zur Gewährleistung von DR in einem virtuellen Rechenzentrum ist die Hypervisor-basierte Replikation mit Continuous Data Replication (CDP), die nicht nur die Gefahr logischer Fehler löst, sondern auch DR-Tests zum Kinderspiel macht. Diese Lösung für Backup und Recovery garantiert sehr niedrige RTOs mit Recovery Automation und kurze RPOs dank CDP.

DR-Report(Quelle: Zerto)

So ausgestattet, können DR-Tests täglich ausgeführt werden, ohne Planung oder Unterbrechung der Workloads, mit nur wenigen Klicks und einem auditfähigem Bericht, der den genauen RTO angibt. Auch kann man nicht nur die kontinuierliche Verfügbarkeit während des DR-Tests sicherstellen, sondern auch die Verfügbarkeit bei der Migration und Verlagerung von Workloads in die Cloud.

Jemand von euch, der heuer mit einem solchen Test befasst ist/war? Anmerkungen zum Thema und dem hier beschriebenen Verfahren?

Über Zerto
Zerto stellt innovative, einfache, zuverlässige und skalierbare Softwarelösungen zur Gewährleistung der Geschäftskontinuität bereit, um den Betrieb von Unternehmen und der Cloud-IT rund um die Uhr aufrechtzuerhalten. Die Zerto Cloud Continuity Platform™ ermöglicht es Unternehmen, virtuelle Arbeitslasten nahtlos zu schützen sowie zwischen der Public Cloud, der Private Cloud und der Hybrid Cloud zu verschieben. Das Flaggschiffprodukt des Unternehmens, Zerto Virtual Replication, ist mittlerweile der Standard für den Schutz, die Wiederherstellung und die Migration von Anwendungen in Cloud- und virtualisierten Rechenzentren.


Cookies blockieren entzieht uns die Finanzierung: Cookie-Einstellungen

Anzeige


Dieser Beitrag wurde unter Allgemein abgelegt und mit Allgemein verschlagwortet. Setze ein Lesezeichen auf den Permalink.

4 Antworten zu Alle Jahre wieder – kommt der DR-Test

  1. Michael Bormann sagt:

    ?
    das wäre toll aber impliziert auch
    Die Dokumentation der Systeme muss stimmen und da geht es schon los.

    Live-Systeme knöcheln ist unbeliebt, das macht der gewachsene Admin doch lieber auf Ersatzsystemen aber wo werden die wirklich vorgehalten?
    So manche Systeme dürfen auch zwischen den Tagen nicht unbedingt "runtergehen" es gibt immer Leute die "Last Minute" nachlegen, RAs (hat sich ja gerade elegant erledigt) , Steuerberater und andere kritische Fälle ach Datev passt auch super in diese Kategorie oder? ?

    Restartpläne sind auch selten auf aktuellem Stand, nehmen wir mal Zeus (Metallbau) und Konsorten mit Oracle-DB, da gibt es auch Überraschungen.

    Alles nicht so einfach und was bin ich froh dem Zirkus mittlerweile entfleucht zu sein, aber echt ?

    • Frank B. sagt:

      Zitat: "Ersatzsystemen aber wo werden die wirklich vorgehalten?"

      Nirgends.

      Der Controller (oder der Chef) flippt aus, weil das die Kosten unnötig erhöht.

      Wofür ein System einkaufen, welches nicht PRODUKTIV genutzt werden kann.

  2. der_Puritaner sagt:

    Ach ja das hab ich eigentlich schon Anfang Dezember gemacht, war so zusagen ein Live Test, Chef hat wegen Umbaumaßnahmen im Studio kurzerhand die Stromzufuhr an dem der Router, WLan, Switsch, Patchfeld, Musikserver und Server hingen gekappt.
    3 Std Später ging bei mir die SMS ein das seit 3 Std. nichts mehr ginge, Telefone sind ja seit Januar VoIP umgestellt (auf denen meine Ruf-Nummer für Notfälle gespeichert ist) hängen ja am Router und dort ist auch die Telefonliste gespeichert ohne Strom geht gar nichts.
    20Minuten Radtour ins Studio, 30 Minuten hin und zurück zum Baumarkt für eine 30 Euro Kabeltrommel, mit anschließenden bangen und hoffen das alles wieder hoch fährt da die Backups für den Server mich noch mal 40 Minuten Rad Tour gekostet hätten weil ein Server mit einem Raid sollte man ja vorher runter fahren anstatt die Holzhammer Methode mit Strom Kappen zu nutzen.

    Hat aber alle prima innerhalb von 3Std. und 50 Minuten Arbeit geklappt.

    Es gibt Chefs den sollte man nicht mal eine Nagelschere in die Hand drücken ;)

  3. Michael Bormann sagt:

    kicher ?

Schreibe einen Kommentar zu Michael Bormann Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht.

Hinweis: Bitte beachtet die Regeln zum Kommentieren im Blog (Erstkommentare und Verlinktes landet in der Moderation, gebe ich alle paar Stunden frei, SEO-Posts/SPAM lösche ich rigoros). Kommentare abseits des Themas bitte unter Diskussion.