Was ist, wenn ein Tornado IHR Rechenzentrum durchquert?

8

Am vergangenen Wochenende hatten wir hier in Virginia schwere Stürme und natürlich erinnert die Krise in Japan daran, dass die Dinge sofort schlecht werden können! Eine Frage, die ich mir stelle: "Was ist, wenn ein Tornado mein Rechenzentrum trifft? Bin ich vorbereitet?"

Ich habe großartige Backup-Systeme "in meinem Rack", einschließlich einer Bandsicherung. Da sich das Rechenzentrum nicht in der Nähe befindet, ist das Verschieben von Bändern außerhalb des Standorts nicht möglich. Was ich suchen oder erstellen möchte, ist ein System, das nach einem Zeitplan wichtige Elemente wie Websites und Datenbanken sichern und remote kopieren kann, z. B. meinen Server zu Hause. Ich habe FIOS mit 35-Mbit-Dienst, also habe ich das Breitband. Was ich brauche, ist das "System", um dies zu tun. Ich bin ein Programmierer, damit ich nach einem Zeitplan etwas erstellen kann, das die Informationen von FTP nicht enthält, aber ich bin gespannt, ob es etwas gibt, das diesen Bedarf an Remote-Backups jetzt erfüllt. Meine SQL Server werden auf Speicher-Arrays gesichert. Ich könnte diese Sicherungen herunterfahren oder sogar meinen SQL Server hier planen, um nach einem Zeitplan mit den Produktionsservern zu synchronisieren. Ich verwende Windows Server 2008 R2 und SQL Server 2008 R2.

Was empfehlen Sie alle für eine Off-Site-Strategie in einer Krise wie einer Naturkatastrophe, die unser Rechenzentrum zum Erliegen bringt? Bist du vorbereitet? Ich hoffe, andere stellen sich diese Frage und lernen aus diesen Naturkatastrophen, die wir allzu oft gesehen haben.

Neal
quelle

Antworten:

6

Ihre Optionen sollten durch Ihre Service Level Agreements mit Ihren Kunden bestimmt und durch Ihr Budget begrenzt werden.

Zumindest sollten Sie externe Backups aller kritischen Daten haben. Das heißt, heute müssen alle Daten, die Sie nicht von Grund auf neu erstellen können, an anderer Stelle gespeichert werden. Offline-Backups sind besser: Online-Backups oder Replikationen können hilfreich sein, wenn ein Tornado auftritt. Was passiert jedoch, wenn ein verärgerter Mitarbeiter eine Datenbank löscht oder ein Dateisystem zerstört?

Anhand einer Basis von Offline-Sicherungen können Sie Optionen untersuchen, die die Wiederherstellung im Austausch gegen höhere Kosten beschleunigen. Hier gibt es eine Vielzahl von Optionen, die von einem einzelnen Host für von Ihnen beschriebene Online-Sicherungen bis hin zu vollständig replizierten Umgebungen mit synchroner Datenreplikation reichen, die aktiv (-aktiv) + für Ausfallzeiten nahe Null ausgeführt wird.

Die Wiederherstellung von Grund auf ist viel einfacher, wenn Sie Ihre Daten so sauber wie möglich von Ihrer Infrastruktur trennen. Zum Beispiel wird die Wiederherstellung von Grund auf viel schneller sein, wenn Sie Systeme wie Marionette oder Koch anstatt von Hand bereitstellen. Das Wiederherstellen aller Arbeiten, die Sie in den Aufbau Ihrer Systeme gesteckt haben, ist viel schneller, wenn Sie so viel wie möglich automatisieren können. Wenn Sie die Daten getrennt halten, wird auch die Datenmenge reduziert, die Sie sichern müssen: Spinnen Sie keine Gigabyte des Betriebssystems ab, wenn Sie wirklich nur ein paar Megabyte Systemkonfigurationen und Anwendungsdaten benötigen.

Die Optionen können recht teuer werden. Sie müssen daher festlegen, was Ihr Unternehmen für die Notfallwiederherstellung bereit ist und wie viel Ausfallzeit Ihre Kunden tolerieren können. Beseitigen Sie die Optionen, die für Ihre Kunden zu teuer oder zu langsam sind.

Wenn Sie sich für eine Disaster Recovery-Lösung entschieden haben, stellen Sie sicher, dass Sie diese üben. Ich würde mindestens einmal im Jahr oder immer dann empfehlen, wenn sich Ihre Architektur ändert, je nachdem, was häufiger vorkommt.

Cakemox
quelle
2

Business Continuity geht viel weiter, als nur sicherzustellen, dass Sie Zugriff auf lesbare Backups haben. Wenn Sie den Umfang der Antwort jedoch auf genau das beschränken, ist dies letztendlich nur dann sinnvoll, wenn die End-to-End- Bandbreite vom Rechenzentrum zum Sicherungsspeicherort ausreichend groß ist, um das Datenvolumen zu bewältigen.

Wenn Sie über ein Rechenzentrum sprechen, sind das für die meisten Menschen Gigaytes an Daten pro Woche.

IME, selbst im kleinen Maßstab ist die beste Lösung eine verteilte (oder gespiegelte) Operation. Planen Sie es richtig und es sollte im Vergleich zu einem einzelnen Rechenzentrum wenig Kosten verursachen.

Wenn Sie jedoch alle Daten an einen Standby-Speicherort oder einfach nur an einen Remotespeicher kopieren müssen, dann

1) Verwenden Sie kein FTP - es ist aus vielen Gründen einfach der falsche Weg

2) Verwenden Sie für generische Dateien etwas wie rsync, das für diesen Zweck optimiert ist

3) Sehen Sie sich für Datenbanken die Tools an, die speziell für Ihr DBMS verfügbar sind. Die Dateistruktur kann sich massiv ändern, ohne dass sich die Daten stark ändern. Hinweis: Dies umfasst die MSWindows-Registrierung und MSAD-Daten.

symcbean
quelle
1

Wir haben ein VPN von unserem Büro zu unserem externen Rechenzentrum. Im externen Rechenzentrum haben wir einen Server, auf dem eine Netzwerkfreigabe bereitgestellt ist, die wir als Ziel in unserer Sicherungssoftware konfigurieren (wir führen Symantec BackupExec aus), dh \ OFFSITEDATACENTER \ OFFSITESTORAGE

Wir machen dann - eine vollständige Sicherung über das Wochenende an diesem Ort
- jeden Abend eine inkrementelle Sicherung

Sowie unsere normalen "Vor-Ort" -Sicherungen

Wir führen auch VMWare VDR aus, um jede Woche Bilder von unseren Hauptservern aufzunehmen, die auf eine mit FreeOTFE verschlüsselte 2-TB-SATA-Festplatte gespeichert werden, die ich jede Woche mit nach Hause nehme.

Phil
quelle
1

Wir haben eine Reihe von separaten aktiven / aktiven oder aktiven / semi-aktiven Rechenzentren mit einem Abstand von> 50 Meilen, verschiedenen Stromversorgern, Sicherheit, unterschiedlich gerouteten 10-GBit / s-Netzverbindungen zwischen ihnen, oh, und wir versenden unsere Sicherungsdisketten auch zwischen ihnen. Das tut für uns.

Chopper3
quelle
0

Die Einzelheiten der Handhabung eines bestimmten Sicherungsschemas wurden hier und anderswo ad nauseum behandelt. Ich werde diese Frage unter dem Gesichtspunkt der allgemeinen Richtlinien auf höherer Ebene angehen, um Ihnen bei der Entscheidung zu helfen, wie Sie sich der Notfallwiederherstellung nähern sollen. Ich war in einigen Situationen, in denen eine Planung erforderlich war, falls das Rechenzentrum zu einem rauchenden Krater wurde. Zum Glück mussten wir es nur einmal benutzen. Die wichtigsten Dinge, an die Sie sich erinnern sollten, sind:

1) Verschwenden Sie nicht Ihre Zeit damit, zu überarbeiten und alles mit einer Genauigkeit von <1 ms ausfallen zu lassen, wenn Sie dies nicht müssen. Ein vollständiger Ausfall dieser Größenordnung entschuldigt im Allgemeinen einige Stunden Erholung.

2) Stellen Sie als Folge von Nummer 1 sicher, dass die Erwartungen realistisch bestimmt und irgendwo in einer Richtlinie kodiert sind. Es ist wichtig, ein festgelegtes Ziel zu haben, um die Erholungszeit zu erreichen, da Sie unbegrenzt Zeit verbringen können und das Geldverdienen "noch besser" ist.

3) Priorisieren Sie Ihre Systeme. Der Plan für die Wiederherstellung muss auf einer endgültigen Liste der Bedeutung jedes einzelnen Systems basieren. Verpassen Sie auch nicht die offensichtlichen Dinge, wie das Einrichten von DNS und AD vor dem Rest der Windows-Server.

4) Wenn es nicht außerhalb und außerhalb des Netzwerks ist, ist es nur eine Kopie. Dies steht im Einklang mit einem weiteren wichtigen Punkt: RAID ist kein Sicherungsplan.

5) Test, Test, TEST! Testen Sie jeden Zentimeter Ihres Plans, den Sie können. Wenn Sie in der Lage sind, für einen Wartungszeitraum ein Wochenende frei zu bekommen, trennen Sie den Uplink und / oder die Gebäudeenergie und testen Sie die Reaktionszeit und Effektivität Ihres Teams. Ein Disaster Recovery-Plan, der nie getestet wurde, ist nur Wunschdenken.

Hyppy
quelle