Warum ist die Größe eines PDFs mit eingebetteten Bildern im Vergleich zu den einzelnen Bildern selbst so groß?

1

Ich habe ein PDF, in dem jede Seite ein Vollfarbenbild ist (es ist ein Artbook). Es gibt 16 Seiten. Eine Seite ist komplett leer.

Das PDF selbst ist 140 MB groß. Wenn ich jedes Bild in BMP extrahiere, belegen die Bilder nur 30 MB. Verlustfreie Komprimierung zu PNG ergab 13 MB.

Wie ist es möglich, dass das PDF 140 MB groß ist, wenn die Bilder selbst 30 MB groß sind (wahrscheinlich schlimmstenfalls)? Verwenden PDFs eine äußerst ineffiziente Methode zum Speichern von Bilddaten, bei denen jedes Pixel mehr als 4 Byte belegt?

Ich mag PDF, weil viele Anwendungen es unterstützen, ohne zusätzliche Software / Plugins installieren zu müssen, aber das fand ich ziemlich seltsam.

Ich bin mir nicht sicher, ob dieses spezielle PDF nur ein Sonderfall ist.

That Umbrella Guy
quelle

Antworten:

0

Mit welcher Software arbeiten Sie? "Extrakt" bilder aus pdf?

Denken Sie daran, dass Sie zum Extrahieren von Bildern aus PDFs in ihrer nativen Auflösung verwenden müssen

pdfimages

Hier können Sie Binärdateien für Microsoft Windows und Linux herunterladen

Verwendungszweck:

pdfimages [options] <PDF-file> <image-root>

Sobald Sie die Bilder in voller Auflösung extrahiert haben, können Sie das Problem richtig einschätzen, das Sie für wahrscheinlich halten

Bei farbigen Bildern hat PDF im Allgemeinen nur eine effiziente Komprimierungsmethode, um die Qualität zu erhalten und die Dateigröße zu verringern

das JPEG-2000

Daher müssen Sie die aus PDF extrahierten Bilder mit PDF-Bildern mit einer konvertierbaren Software neu codieren JPEG-2000 mögen:

  • imagemagick
  • graphicsmagick
  • viele andere

Dann müssen Sie diese mit JPEG-2000 codierten Bilder in ein PDF-Dokument einfügen, ohne sie neu zu codieren. Dies kann sowohl unter Microsoft Windows als auch unter Linux (mit Wine) erfolgen mit:

freepic2pdf

Dingo
quelle
Ich benutze Irfanview, das Ghostscript für die Verarbeitung verwendet. Ich habe nicht versucht, PDFs selbst zu erstellen, aber es könnte sein, dass ich versuche zu sehen, wie meine Ausgabe im Vergleich zu der des Autors herauskommt (die PDF ist nicht meine).
That Umbrella Guy