Wie wirkt sich die Wortgröße auf die Komprimierung aus?

24

In 7 Zip besteht beim Hinzufügen eines Ordners zu einem Archiv die Möglichkeit, die Word-Größe zu ändern.

Wie wirkt sich diese Wortgröße auf die Komprimierung aus, insbesondere auf die endgültige Größe des Reißverschlusses?

Mir ist aufgefallen, dass die Änderung der Komprimierungsstufe die Wortgröße erhöht, aber selbst bei Ultra wird nur eine Wortgröße von 128 ausgewählt, obwohl die größte Option mehr als doppelt so groß ist. Gibt es einen Grund, warum ultra nicht das größte auswählt? Liegt die optimale Komprimierungsgröße irgendwo zwischen der größten und der kleinsten Wortgröße?

Aequitas
quelle
Sehen Sie sich an, was Shell in diesem Beitrag zu einem Teil Ihrer Fragen hier sagt -> The Post .
Pimp Juice IT
@LMFAO_A_JOKE, die nur für einige Dateien höher sagt, ist manchmal besser nicht
Aequitas
1
Dies BEANTWORTET nicht alle Ihre Fragen im Detail, aber für die EINE Frage von -> How does this word size affect compression, in particular the final size of the zip?Ich denke, die Angabe des Post-Teils WordSize: usually the bigger, the better (and slower) for well-compressible data (such as documents). Archive size depends quite non-monotonically of it.gibt Ihnen eine Erklärung für TEIL Ihrer Fragen. Deshalb habe ich das hier nur für einen Kommentar eingefügt und NICHT geantwortet - ich habe nur versucht, dir etwas zu geben !!!
Pimp Juice IT
Was bedeutet der letzte Satz, Archivgröße ... nicht monoton davon
Aequitas
1
Ich denke, dies bedeutet, dass die Archivgröße "in der Regel" mit zunehmender Größe des WordSize-Werts kleiner (von der Originalgröße abnehmend) wird, aber dies "hängt" von der Komprimierbarkeit der zu komprimierenden Datentypen ab, wie z. B. Text im Gegensatz zu Bilddateien vielleicht als ein Beispiel. Der Vorschlag war, die verschiedenen Werte zu testen, um den bestmöglichen Wert für Ihre Daten zu erhalten, obwohl Sie wissen, dass Sie die besten Optionen für Ihre Anforderungen auswählen.
Pimp Juice IT

Antworten:

8

Es hängt wirklich von den Daten ab, die Sie komprimieren, und dem verwendeten Algorithmus.

Wortgröße

Geben Sie die Länge der Wörter ein, anhand derer identische Bytefolgen für die Komprimierung ermittelt werden. Bei LZMA führt eine große Wortgröße in der Regel zu einem etwas besseren Komprimierungsverhältnis und einem langsameren Komprimierungsprozess. Parameter für große Wortgrößen können die Komprimierungsrate erheblich erhöhen, wenn Dateien lange, identische Bytefolgen enthalten. Für PPMd hat die Wortgröße eine große Bedeutung. Dies wirkt sich stark auf das Kompressionsverhältnis und die Kompressions- / Dekompressionsgeschwindigkeit aus.

Hier gibt es einige Vergleiche

Hefewe1zen
quelle