In den letzten Jahren (seit ~ 2000) habe ich ab und zu Daten zwischen Festplatten verschoben und kopiert. Daten sind MP3, Anwendungen, Videos, Backups, E-Mails usw. und sie wurden zwischen mehreren Festplatten (und Festplattenarrays!) Und zwischen mehreren Dateisystemen wie FAT, NTFS, ReiserFS, Ext3, Ext4, JFS usw. verschoben / kopiert.
Kürzlich wurde ich darauf aufmerksam, dass einige RAR-Archive, einige ausführbare Dateien (bei denen es sich tatsächlich um komprimierte Archive handelt) und möglicherweise andere Dateien, die mir noch nicht aufgefallen sind, beschädigt sind. Ich weiß nicht, ob es hier nur unter komprimierten Dateien ein Muster gibt. Ich nehme an, es ist nicht nur dort beschränkt.
Um mit etwas anzufangen, überprüfte ich die Integrität der rar-Dateien in meinem Linux-Dateiserver mit find zusammen mit dem Befehl:
unrar t <rar files>
Das ist schön, aber ich kann nicht alle meine Archive auf diese Weise auf Integrität überprüfen, geschweige denn alle meine anderen Dateien (Dokumente, Fotos, MP3s, WAVs, ZIPs, die Liste ist natürlich endlos)
Ich möchte alle Dateien auf verschiedene Arten überprüfen.
Die Dateisystemprüfung ist offensichtlich gut, aber es kann nicht wirklich helfen, wenn die Daten bereits beschädigt waren, bevor sie auf die Festplatte kopiert wurden, auf der sie sich gerade befinden, oder? Das aktuelle Dateisystem ist JFS.
Könnte die 2. Prüfungsebene MD5-Prüfsummen sein? Ich habe Backups aller meiner Daten und könnte versuchen, die Prüfsummen abzugleichen. Würden beschädigte Dateien mir unterschiedliche Prüfsummen geben? Dies löst das Problem immer noch nicht, wenn eine Datei vor der letzten Kopie meiner Daten beschädigt wurde.
Was könnte ich sonst noch überprüfen, um Ruhe zu finden?
Der Vergleich meiner Daten mit meinen Backups ist ein großer Haken. Wie bei allem, was lebt, haben sich meine Daten im Laufe der Zeit „geändert“ und die Backups sind Momentaufnahmen, die sich danach nie mehr geändert haben. Zum einen hat sich die Verzeichnisstruktur geändert, Dateien wurden offensichtlich gelöscht oder an andere Speicherorte übertragen. Offensichtlich wird es ein Durcheinander sein, wenn der Befehl
find
verwendet wird, um eine Datei zwischen dem Sicherungsbaum und dem aktuellen Baum abzugleichen!
Hat sich jemand mit etwas Ähnlichem befasst und verfügt möglicherweise über Skripte (unter Verwendung von locate oder auf andere Weise), mit denen indizierte Einträge der Dateien schnell gefunden und verwendet werden können?