Wie wird Redundanz beim Zippen implementiert und wie profitiere ich davon?
Ich würde annehmen, dass es darin besteht, die Nachschlagetabellen zweimal zu speichern, damit ein einzelner Fehler nicht den gesamten Rest der Datei ungültig macht. In Bezug auf den Anwendungsfall, möglicherweise beim Speichern der Datei auf einer CD, die einen leichten Kratzer bekommt?
Ich persönlich habe jedoch nie einen Gewinn durch das Hinzufügen von Redundanz zu Zip-Dateien erzielt, und ich neige dazu, sie wegzulassen. Daher habe ich mich gefragt, ob sie in der Praxis tatsächlich nützlich sind.
Antworten:
Ich glaube, Sie sprechen über den adaptiven LZ-Algorithmus. Es wird nicht als Redundanz bezeichnet, da beim Erstellen der Zip-Datei alles dupliziert wird. Der Begriff stammt von der Funktionsweise dieser Komprimierungsmethode.
Zur Veranschaulichung hier ein Beispiel. Angenommen, ich hatte ein Dokument mit dem Satz:
Wenn ich diesen Satz durch Redundanz kürzer machen wollte, würde ich zuerst ein Wörterbuch erstellen, das alle Wörter enthält, die so wiederholt wurden
Und dann würde ich den Satz umschreiben als
Wenn ich es dann weiter komprimieren möchte, kann ich meinem Wörterbuch Folgendes hinzufügen:
Damit es wird
Wie Sie sehen, ist die Komprimierung umso größer, je mehr Redundanzprüfungen Sie durchführen. Sie erhöhen aber auch die Wahrscheinlichkeit von Korruption. Dies liegt daran, dass das Wörterbuch mit zunehmendem Wachstum anfälliger für Beschädigungen wird und der Rest nicht gelesen werden kann, wenn ein Teil des Wörterbuchs beschädigt wird.
quelle