Langzeitspeicherung geschäftskritischer Daten

16

Dies ist eine wirklich knifflige Angelegenheit, und bis zu einem gewissen Grad handelt es sich nicht um ein technisches Problem, das möglicherweise nicht hierher gehört, aber

Server Fault ist für Systemadministratoren bestimmt, die Computer professionell verwalten oder warten

Und das tue ich .. und das ist eine meiner Aufgaben .. Wie auch immer.

Stellen Sie sich vor, Sie hätten über 5000 doppelseitige A4-Seiten. Unternehmensdaten, alle geschäftskritisch.
Sie müssen es irgendwie sichern. Vorgeschlagene Lösungen sind bisher:

  1. PDF -> Online Speicher
  2. PDF -> DVD / BluRay / Tape
  3. PDF -> Portable HDD / SSD / Flash-Laufwerk.
  4. Kaufen / leasen / mieten / 'stehlen' Sie einen großen Kopierer und machen Sie Kopien.
  5. ???

Sofortige Probleme mit den oben genannten:

  1. Was ist, wenn der Speicherpartner pleite geht?
  2. DVDs verrotten im Laufe der Zeit. Bänder ähnlich.
  3. Auch diese brechen mit der Zeit.
  4. Teuer. Schleppend. Schwer. Nicht baumfreundlich.

Die Fragen):

Was ist der Goldstandard für die langfristige Speicherung und Archivierung von Daten? Haben Sie ein ähnliches Problem am Arbeitsplatz gelöst?

Nach dem ersten Laden müssen der Sammlung etwa 100 Seiten pro Monat hinzugefügt werden. Das Abrufen sollte problemlos möglich sein, ist jedoch wahrscheinlich selten.
Idealerweise möchte ich garantieren, dass die Lösung lange nach meinem Ausscheiden aus dem Unternehmen funktionsfähig ist und keine große Menge erforderlich ist, um sie wartbar zu halten. Daher ist das Speichern vieler DVDs nicht nur nicht ideal, sondern auch nicht eine gute langfristige lösung.

Das Erstellen von Kopien auf Papier ist sicherlich das einfachste, aber bei weitem nicht das umweltfreundlichste. Es ist auch nicht sehr handlich, schwierig zu suchen, zu indizieren und so weiter. Kombiniert mit schweren und schwer physikalisch zu lagern.

Die Idee, alles elektronisch zu speichern, gefällt mir im Prinzip ganz gut, aber der eigentliche Mechanismus dafür muss transparent und einfach sein. Ich möchte wirklich nicht für immer und einen Tag dafür verantwortlich sein, Büronutzer dabei zu unterstützen, wie sie es in den Griff bekommen und Dokumente verlieren. Ich möchte auch nicht auf einen einzigen Speicheranbieter angewiesen sein. Was wäre, wenn Dropbox (wir haben eine Online-Backup-Lösung für Geldautomaten, aber keine Dropbox) pleite gehen oder auf andere Weise ein katastrophales Ereignis erleiden würde, wie viele Unternehmen Wer nutzt ihre Dienste wäre den Bach hinauf, ohne Paddel?

Es gibt hier eine gewisse Budgetflexibilität, aber ich vermute, dass alles, was mehr kostet als unser aktuelles Online-Backup (etwa 2500 USD / Jahr), weniger als günstig angesehen wird, als es nur in einem Schuhkarton unter einem Bett zu verstauen. Was zweifellos passieren würde, wenn ich nichts tun und morgen zurücktreten würde.

Irgendwelche Ideen?

-Bearbeiten-

Dafür gibt es zwei Gründe.

1) für den Fall, dass das Büro niederbrennt, eine vernünftige und sichere Sicherung der geschäftskritischen Unterlagen bereitstellen.

2) Datenarchivierungsgesetze WRT uk Steuerrecht für Unternehmen und so weiter zu erfüllen.

Bearbeiten 2:

Ein Mechanismus zum Indizieren der Dokumente wäre auch verdammt nützlich.

Tom O'Connor
quelle
Ich habe ein schnelles Skript für PDF-> Txt mit Ghostscript und Gocr erstellt. Ich überlege mir nicht, alles in eine SQLlite-Datenbank zu packen, um einen interessanten Index für die Daten zu erstellen.
Tom O'Connor
Redundanz (von digitalen Medien) und Aufrechterhaltung der Redundanz über die Jahre hinweg können Ihre besten Freunde sein.
Vortico

Antworten:

5

Das Speichern der Daten in einem Format wie PDF ist wahrscheinlich sicher, da es kostenlose Tools zum Lesen gibt. Das Datenvolumen, von dem Sie sprechen, ist relativ gering (1.200 Seiten / Jahr), sodass Sie selbst bei einer Scanauflösung von 300 dpi nur von zehn Gigabyte pro Jahr sprechen.

Das Problem mit den physischen Speichergeräten wird jedoch nie verschwinden. Unabhängig davon, welche Medien Sie zum Speichern elektronischer Daten (Band, optisch usw.) verwenden, müssen Sie eventuell auf ein neueres Medium aktualisieren. Planen und budgetieren Sie, um die Daten auf neue Formate umzustellen, da neue Formate ältere Formate ersetzen.

Ich würde mir wahrscheinlich optische Medien als erste Wahl ansehen, nur weil Sie so wenig Daten haben. Ich würde auch planen, 3x Duplikate von allem zu brennen und die Medien alle 2 - 3 Jahre zu aktualisieren.

Wenn das optische Medium zu klein ist, würde ich es alle 4 - 5 Jahre mit LTO-Band auffrischen. Für eine so kleine Datenmenge ist das allerdings ziemlich teuer.

Evan Anderson
quelle
DVD? Oder Blu-ray? Ist BR schon ein vernünftiges Format für Daten?
Tom O'Connor
1
@ Tom O'Connor: Sie scheinen mir gleich zu sein. Ich würde mir die Kosten ansehen, um diese Entscheidung zu treffen. Derzeit gibt es Blu-Ray-Rohlinge in Archivqualität. Aus technischer Sicht scheint es sich also um ein brauchbares Format zu handeln. (Hersteller, die sagen, dass Blu-Ray-Medien eine "bewertete" Lebensdauer von 200 Jahren haben, geben mir kein größeres Vertrauen als diejenigen, die sagten, dass DVD-Archivmedien eine "bewertete" Lebensdauer von 100 Jahren haben ...)
Evan Anderson
Ich habe einige Kodak GOLD-CD-Rs von etwa 1998 und sie sind immer noch lesbar. Ich habe auch einige freie, bei denen sich die Farbstoffschicht abgelöst hat und die verschraubt sind.
Tom O'Connor
Ich behaupte nicht, dass es keinen Unterschied zwischen archivierten und nicht archivierten Medien gibt. Ich sage nur, dass Blu-Ray-Medien für Archivzwecke im Vergleich zu DVD-Medien für Archivzwecke für mich nicht viel anders zu sein scheinen. Der Vergleich von Archivierungsgrad und "Spindel von 100 für 20,00 US-Dollar" -Medien ist eine ganz andere Geschichte.
Evan Anderson
Ein Punkt, der nicht erwähnt wurde, war der Solid-State-Speicher (USB-Sticks): Größer als optisch, kleiner als LTO. USB gibt es wahrscheinlich noch mindestens ein oder zwei Jahrzehnte, und ein 16-GB- oder 32-GB-USB-Stick (oder zwei oder drei) ist im Hinblick auf die Archivierungskosten recht günstig. Da es "Write-Once-Read-Many" gibt, müssen Sie sich keine Gedanken mehr über die Abnutzung der SSD-Zellen machen, sodass Sie die Stöcke theoretisch 5 oder mehr Jahre in einem feuerfesten Tresor aufbewahren können.
Voretaq7
6

Es gibt spezielle Systeme, die intern DVDs verwenden und die Daten von Zeit zu Zeit auf neue Medien migrieren. Digitale Aufbewahrung nachschlagen.

Da die Speicheranforderungen ziemlich schnell steigen, ist es ratsam, auf jeden Fall alle paar Jahre auf einen neueren, größeren Medientyp zu wechseln.

Vorausgesetzt, Sie erhalten die Daten in Papierform, müssen Sie:

  1. Listen Sie die Daten bei der Maileingabe auf. Dies kann bedeuten, dass jedem Blatt ein eindeutiger Barcode zugewiesen wird.
  2. Scannen Sie es. Verwenden Sie den Barcode als Dateinamen. Archivieren Sie das Papier.
  3. Archivieren Sie die Daten. Stellen Sie die Daten auf ein revisionssicheres Archivierungssystem. Ein Dateiserver ist nicht gut genug, da möglicherweise etwas mit den Dateien passiert, wenn sie schreibgeschützt sind.
  4. Machen Sie es für andere Systeme lesbar.

Im Kundenfall müssen alle Rechnungen für eine große Organisation an das Online-System (SAP) übergeben werden. Der Archivspeicher durchlief inzwischen mehrere Iterationen. Derzeit bewegen sie sich zu Blue Ray.

Auf der anderen Seite läuft heutzutage alles auf Datenträgern. Vielleicht ist etwas in dieser Richtung Ihr Weg: http://www.eurostor.com/german/iTernity.D.php

Posipiet
quelle
Denken Sie daran, dass die meisten DVD-Rs (ua) nur einige Jahre halten, bevor sie sich verschlechtern. Das teure Archivmaterial hält länger, wenn es gemäß den Anweisungen aufbewahrt wird.
Chris S
Dies gilt auch für die meisten Festplatten, Server, Dateisysteme oder Dokumentformate. Archivieren heißt, die Daten zu verschieben. Versuchen Sie in 20 Jahren ein PDF zu lesen. Erinnerst du dich, was der Standard vor 10 Jahren war? Wir haben eigentlich nichts, was an Papier heranreicht. Mit Ausnahme von Kopieren und Einfügen ...
Posipiet
Reine Textdokumente sind noch gut lesbar.
Bart Silverstrim
Es gibt kostenlose Tools zum Lesen von PDFs. Solange es sich um "reine Vanille" handelt, wäre ich nicht zu besorgt. Auch TIFF ist eine gute Option.
Evan Anderson
3

Unsere Lösung: Scan to PDF -> Backup to Tape

Wir haben einen Dokumentenscanner, der ca. 30 Seiten / min leistet und OCR-PDF-Dateien erstellt. Wir sichern diese auf Band (speziell LTO4) mit einer Haltbarkeit von 50 bis 100 Jahren (das Auffinden eines Bandlaufwerks kann im Zeitrahmen schwierig sein, es gibt jedoch Datenwiederherstellungsorte, auf denen immer noch 8-Zoll-Disketten wiederhergestellt werden können).

Chris S
quelle
2
Ich musste 8 "Diskette googeln ....
Holocryptic
Ich behalte meine Sicherungsbänder von Mac OS 7.5. Aber die Festplatte ist kaputt gegangen, der Datenträger des Sicherungsprogramms ist verloren gegangen. Ich habe es geschafft, den Mac neu zu installieren, aber ich kann das Band nicht lesen, weil ich kein Backup-Programm habe. Und ehrlich gesagt erinnere ich mich nicht einmal an seinen Namen. Ja, das Band kann 100 Jahre dauern. Aber der Leser tut es nicht.
Posipiet
@Holocryptic: Vor ein paar Monaten habe ich eine ungeöffnete Schachtel mit 8 "-Disketten mit festem Sektor von Verbatim
ausgeworfen
1
@Holocryptic: NSFW! NSFW !!
Bart Silverstrim
@Posipiet, ich denke, ich habe die Tatsache behandelt, dass Laufwerke nicht ewig halten, aber es gibt Unternehmen, die sich darauf spezialisiert haben, Daten von praktisch allen gängigen Medien wiederherzustellen.
Chris S
3

Ich denke, der neue Glacier-Service von Amazon ist ein interessantes Angebot in diesem Bereich.

Amazon Glacier ist für Daten optimiert, auf die selten zugegriffen wird und für die Abrufzeiten von mehreren Stunden geeignet sind. Mit Amazon Glacier können Kunden große oder kleine Datenmengen für nur 0,01 USD pro Gigabyte und Monat zuverlässig speichern. Dies ist eine erhebliche Ersparnis im Vergleich zu lokalen Lösungen.

ewwhite
quelle
2
Die Abrufkosten sind wahnsinnig hoch.
Tom O'Connor
2

Schritt eins: Sichern: Erfassen Sie die Dokumente und ordnen Sie alle Wörter in einer Reihe von Romanen über die katholische Kirche, das Opus Dei und die Templer neu an. Sie sollten über genügend Eingabedaten für ungefähr 10 Romane verfügen, und ungefähr jedes Jahr oder so für immer. Führen Sie eine Nachschlagetabelle, die den ursprünglichen Speicherort der Wörter in den Quelldokumenten (in der Quellreihenfolge) und den endgültigen Speicherort in den Romanen enthält. Speichern Sie doppelte Wörter in einem Eintrag in der Tabelle. Sichern Sie sich einen Veröffentlichungsvertrag und lassen Sie Millionen der Romane veröffentlichen. Verwenden Sie die Einnahmen aus dem Buchverkauf, um die OCR- und Wortumordnungsoperation zu finanzieren. Zerkleinern Sie die Originaldokumente und verkaufen Sie sie als Hamsterbett. Gelegentlich kann es erforderlich sein, Bestellungen für Kruzifixe, Antimaterie oder Flugtickets an exotischen Orten aufzugeben, wenn Sie feststellen, dass in Ihren Eingabedokumenten kein Wortschatz vorhanden ist.

Schritt zwei, Wiederherstellung / Zugriff: Es müssen keine Kopien der Daten gespeichert werden. Sie benötigen lediglich Ihre Nachschlagetabelle und einen Antiquariat.

Da die Nachschlagetabelle Ihre einzige Fehlerquelle ist, müssen Sie diese weiterhin sichern. Dank des verwendeten Huffman-Codierungsschemas ist dieses Format im Vergleich zu Ihren Eingabedokumenten recht klein und kann möglicherweise auf DVD kopiert werden. Setzen Sie sich für Offsite-Backups vor ein Kaminfeuer und lesen Sie die Nachschlagetabelle aus, während Sie sich selbst ein Video machen. Stellen Sie Ihr Video-Performance-Stück über die Verschmelzung von Kunst und Technologie in der Tate Modern Gallery dauerhaft aus.

Duncan Lock
quelle
1

Etwas zu früh, um es zu kaufen, aber es scheint, als hätte HDS einen permanenten Datenspeichermechanismus auf Quarzbasis entwickelt - lesen Sie .

Chopper3
quelle
1
Ich habe die Behauptung über die Dauerhaftigkeit so oft gehört, dass ich es nie glauben werde und keiner von uns lange genug leben wird, um jemals zu sehen, dass es bewiesen ist. Vorhersagen der Dauerhaftigkeit sind absolut wertlos und werden ausnahmslos als falsch erwiesen.
John Gardeniers
-2

Ich muss Humyo.com vorschlagen (gekauft von Trend Micro - der zweite Vorname ist Sicherheit)

Sie verschlüsseln alle Benutzerdaten und ihre Server sind in der Bank of England in einem Tresor untergebracht.

Ziemlich sicher :)

benhowdle89
quelle
1
Ich wette, sie sind eigentlich nicht in der Bank of England. Es ist kein Platz da drin, es ist voller Banker.
Tom O'Connor
5
Trend Micro, dessen zweiter Vorname Bloatware ist ...
Tom O'Connor
Ich stimme Ihnen in
Bezug