Ich habe gerade erfahren, dass PDF-Dateien komprimiert werden können, um ihre Festplattengröße zu reduzieren.
- Ich habe mich gefragt, ob eine PDF-Datei bereits komprimiert wurde.
- Mit welchen Anwendungen / Befehlen kann eine PDF-Datei komprimiert oder dekomprimiert werden?
Meine Umgebung ist Linux Ubuntu 10.10.
Einige Versuche liefern keine zufriedenstellenden Ergebnisse:
Hier sind die Ergebnisse des Versuchs
pdftk
:$ pdftk 3.pdf output 5.pdf uncompress $ pdftk 3.pdf output 3comp.pdf compress $ ls -l 3.pdf 3comp.pdf 5.pdf -rwxrwx--- 1 root plugdev 8652269 2011-07-30 12:27 3comp.pdf -rwxrwx--- 1 root plugdev 8652319 2011-07-29 22:15 3.pdf -rwxrwx--- 1 root plugdev 16829828 2011-07-30 12:27 5.pdf
Die Eigenschaften der Dateien zeigen, dass nicht alle optimiert sind.
Ergebnisse der Konvertierung nach ps und dann zurück nach pdf:
$ pdf2ps 3.pdf 3.ps $ ps2pdf 3.ps 3c.pdf $ ls -l 3.pdf 3.ps 3c.pdf -rwxrwx--- 1 root plugdev 8808946 2011-07-30 13:14 3c.pdf -rwxrwx--- 1 root plugdev 8652319 2011-07-29 22:15 3.pdf -rwxrwx--- 1 root plugdev 122375966 2011-07-30 13:14 3.ps
file
. Es sollte zeigen, ob die Datei komprimiert ist oder nicht.$file 3.pdf
ist3.pdf: PDF document, version 1.4
Antworten:
Zusamenfassend:
Um zu wissen, ob es bereits komprimiert ist:
strings your.pdf | grep /Filter
Verwenden Sie QPDF , um eine PDF-Datei zu ( dekomprimieren)
Erläuterung:
Das Schlüsselwort "Filter" in einer PDF-Datei ist ein Indikator für die verwendete Komprimierungsmethode. Einige von ihnen sind:
(von hier kopiert ).
Angesichts der komplexen PDF-Dateistruktur wird jedoch ein Teil (oder "Stream") der PDF-Datei meistens bereits auf irgendeine Weise komprimiert (und beim Greifen / Filtern angezeigt), während dies bei einem anderen Teil nicht der Fall ist Es gibt keine JA / NEIN-Antwort auf die Frage, ob das PDF komprimiert ist.
ein Weg , dies zu überwinden wäre, die hinzuzufügen
-c
Option zu grep, die die Anzahl der Vorkommen gibt, so dass man sehen konnte , relativ , wie gut es zusammengedrückt wird. Wenn zum Beispiel weniger als 10 zurückgegeben werden, ist es ziemlich unkomprimiert.strings
"large
.pdf" | grep -c /Filter
Eine weitere Eigenschaft in Bezug auf die Größe von PDFs ist, ob sie für den schnellen Zugriff optimiert wurden, wobei "optimierte" PDFs größer sind, um aus Wikipedia zu zitieren :
Mit können Sie prüfen, ob das PDF optimiert ist
pdfinfo your.pdf
.quelle
qpdf
und in etwapdftk
dasselbe in Bezug auf die Komprimierung tun, aberqpdf
auch optimieren können (plus viele weitere Dinge).pdftk ist ein Tool, mit dem Sie einige Operationen an PDF-Dateien ausführen können, z. B. Komprimierung / Dekomprimierung:
quelle
pdfinfo file.pdf
, ob ein PDF optimiert ist . Ich bin mir jedoch nicht sicher, ob das komprimiert bedeutet oder nicht.Ich habe die Komprimierungsmethode in der PDF-Datei gefunden. Öffnen Sie das PDF mit dem Texteditor. Führen Sie eine CCITT-Suche oder -Suche durch, wenn sie nicht gefunden wurde. Geben Sie JPEG, Flate, JBIG2, LZW, RLE und ZIP ein.
Klingt schlimmer als es ist! Sehr einfach, die Komprimierungsmethode des Datenstroms zu finden.
quelle
Überprüfen Sie einfach seine Eigenschaften; Es wird angezeigt, ob die Datei komprimiert ist oder nicht.
quelle