Meine Organisation hat kürzlich ein Speichersystem gekauft. Es hat 1,5 Petabyte, mit RAID6, und es gibt einen online synchronisierten Spiegel an einem physisch anderen Ort.
Das System ermöglicht das Zurücksetzen / Wiederherstellen von Dateien. Standardmäßig sind bis zu 30 Tage zulässig, dies kann jedoch erhöht werden.
Es wird diskutiert, ob wir eine zusätzliche Sicherung für Daten benötigen, die nur auf dem Speicher gespeichert sind.
Das System hat ein sehr gutes Redundanzniveau, es hat geografische Redundanz und ermöglicht bis zu einem gewissen Grad ein Rollback, was bedeutet, dass wir bis zur festgelegten Zeit (standardmäßig 30 Tage) alte Daten oder versehentlich gelöschte Daten wiederherstellen können.
Ist es in diesem Szenario immer noch sinnvoll, ein "traditionelles" Backup zu haben? Mit traditionell meine ich ein dediziertes Backup-System mit Snapshots, die wir abrufen können, falls etwas schief geht.
Brauchen wir das wirklich? Vermisse ich etwas? Denke ich nur auf traditionelle Weise und bin übermäßig eifrig?
Antworten:
Was Sie beschreiben, ist ein geografisch verteiltes RAID und ein RAID war nie ein Backup .
Online-Synchronisierung bedeutet normalerweise, dass alles, was Sie auf dem primären Speicher tun, sofort auf das Backup-System repliziert wird, einschließlich Vorgängen wie dem Löschen (aller) Snapshots und / oder Volumes durch einen Angreifer oder einfach einem Administratorfehler.
quelle
Das 30-Tage-Rollback ist eine großartige Funktion, aber was ist, wenn "Kritisch-Wichtige-Datei-xyz" beschädigt wurde und dies erst über 31 Tage später erkannt wurde? Diese Situation ist der Unterschied zwischen Sicherungs- und Archivierungsplänen, aber in Ihrer Beschreibung wird letzteres nicht erwähnt. Archivierungssysteme werden normalerweise auf sehr kostengünstigen Bändern gespeichert. Es liegen auch keine Informationen darüber vor, ob es sich bei dem Unternehmen um ein Unternehmen handelt, das behördliche oder sonstige Anforderungen zur Aufbewahrung von Daten für einen Zeitraum von mehr als 30 Tagen hat, was häufig der Fall ist.
Wenn dies in Ihrer Situation nicht der Fall ist, sollten Sie gut sein.
quelle
Es ist gut, geografisch getrennte Maschinen zu haben, die beide Daten haben.
Was passiert, wenn an beiden oder allen Standorten mehrere Fehler aufgetreten sind? Ein Feuer bei einem, Diebstahl der Server bei dem anderen? Oder gibt es ein Problem mit der Leitung zwischen ihnen, dann geht der Server des primären Standorts aus, und der HD-Controller geht Affe und schreibt Müll? Oder führt ein Insider böswillige Handlungen an beiden durch? Oder das FBI konfisziert Ihre Server an beiden Standorten wegen des Verdachts (Sie würden es niemals tun, aber vielleicht sind Sie zusammen mit schmucks in einem Rechenzentrum untergebracht). Oder .. Ich erinnere mich an mehrere bekannte "Cloud" -Ausfälle, bei denen alles redundant war und bis zum n-ten Grad analysiert wurde, aber dennoch können Dinge schief gehen. Ich gebe Ihnen zu, dass dies alles unwahrscheinlich ist, aber Sie haben eingeräumt, dass unwahrscheinliche Dinge passieren können.
Es kommt also darauf an, wie wichtig / wertvoll diese Daten sind. Was wird die Organisation tun, wenn sie weg ist?
quelle
Die Frage hier scheint zu sein, wie unverbunden und geografisch eindeutig eine replizierte Kopie Ihrer Daten sein muss, bevor es sich um eine Backup- und keine Hochverfügbarkeits- / Redundanzinfrastruktur handelt. Mein Bauch ist, dass Sie in der Nähe sind, aber noch ein Backup benötigen.
Um einige Gedanken in den anderen Antworten und Kommentaren zusammenzufassen, können Sie den Weg "Nun, die X-Technologie deckt das Y-Katastrophenszenario nicht ab, es handelt sich also nicht um ein Backup" zu einem bestimmten Zeitpunkt weit gehen Sie müssen entscheiden, was für Sie vernünftig ist, und das scheint der Grund zu sein, warum Sie fragen. Ich habe das Gefühl, und ich denke, dass viele der Kommentatoren der Meinung sind, dass Ihr Backup auf einer von Ihren in Gebrauch befindlichen Daten getrennten technologischen Infrastruktur vorhanden sein muss, damit sich Ausfälle, Unfälle und böswillige Handlungen nicht verbreiten können oder müssen eine viel höhere Hürde zu überwinden. Ein Beispiel in den Kommentaren ist, dass jemand die Volumes löscht, was meiner Meinung nach ein gültiges Szenario ist, das sich nicht in die Höhe treibt. Aber auch ein reales Beispiel aus meiner Arbeit. Die Universität, für die ich arbeite (aber zum Glück don ' t Diese Infrastruktur verwalten für) verfügt über eine seriöse hochverfügbare Virtualisierungsinfrastruktur, die viele Campus-Einrichtungen unterstützt. Es befindet sich an mehreren Standorten, läuft jedoch ausschließlich auf der Plattform eines Anbieters. Eines Tages trat ein obskurer Fehler auf, der zu einer Fehlerkaskade führte, bei der zuerst ein einzelner Server heruntergefahren wurde. Als sich die Last verlagerte, wurde der Rest der Site entfernt, und als sich die Last erneut verlagerte, wurden die anderen Hosting-Sites entfernt diese Infrastruktur. (Ich glaube, sie haben dieses Problem seitdem behoben). Die Daten gingen in diesem Fall nicht verloren, aber es ist möglich, sich ein Szenario mit Ihren Daten vorzustellen, in dem sie sich befanden. Eines Tages trat ein obskurer Fehler auf, der zu einer Fehlerkaskade führte, bei der zuerst ein einzelner Server heruntergefahren wurde. Als sich die Last verlagerte, wurde der Rest der Site entfernt, und als sich die Last erneut verlagerte, wurden die anderen Hosting-Sites entfernt diese Infrastruktur. (Ich glaube, sie haben dieses Problem seitdem behoben). Die Daten gingen in diesem Fall nicht verloren, aber es ist möglich, sich ein Szenario mit Ihren Daten vorzustellen, in dem sie sich befanden. Eines Tages trat ein obskurer Fehler auf, der zu einer Fehlerkaskade führte, bei der zuerst ein einzelner Server heruntergefahren wurde. Als sich die Last verlagerte, wurde der Rest der Site entfernt, und als sich die Last erneut verlagerte, wurden die anderen Hosting-Sites entfernt diese Infrastruktur. (Ich glaube, sie haben dieses Problem seitdem behoben). Die Daten gingen in diesem Fall nicht verloren, aber es ist möglich, sich ein Szenario mit Ihren Daten vorzustellen, in dem sie sich befanden.
Sie möchten, dass Ihr Backup vor all dem gefeit ist und auch dann verfügbar ist, wenn diese Infrastruktur nicht verfügbar ist. Wenn die Daten eine Woche lang nicht verfügbar sind, während Ihr RAID wiederhergestellt wird, ist es hilfreich, geschäftskritische Dokumente aus dem Backup wiederherstellen zu können (obwohl dies nicht erforderlich ist). Wenn Ihr RAID verschwindet und dann auf Ihre andere Site repliziert wird, möchten Sie wirklich, dass das Backup von einem separaten Anbieter oder auf einem isolierten Medium wie Band stammt.
Trotzdem wiederhole ich noch einmal, dass sich Ihr Backup auf einer von Ihren Daten getrennten Infrastruktur befinden sollte. Hier gibt es viele Ebenen der Isolation, aber ich denke, dass alles, was durch direkte Replikation verbunden ist, zu nah ist, um ein Backup zu sein. Du wirst zusätzlich etwas wollen.
quelle
Annahme: Das Speichersystem wird von vielen Anwendungen genutzt.
Ich denke, Sie werden mit einem separaten Backup-System viel besser abschneiden.
RAID und Spiegelung sind keine Backups, aber die eingebaute Rollback-Funktion kann ein herkömmliches Backup-System ersetzen.
ABER:
Ich bevorzuge, dass die Wiederherstellungsrichtlinien auf Anwendungen / Daten und nicht auf Speicher basieren, weil:
quelle