Wenn Sie eine PDF-Datei in der Vorschau bearbeiten, mit Anmerkungen versehen oder nur öffnen und speichern, führt dies anscheinend zu einer erheblichen Vergrößerung der Datei. Ich habe festgestellt, dass dies bei einigen Büchern, die ich gescannt habe, auch zu einer Verbesserung der Seitenrendering-Zeit führt.
Kann jemand etwas Licht ins Dunkel bringen, was diese Veränderungen hervorruft? Ich bin daran interessiert, Annotationen von PDF-E-Books zwischen Preview und dem iPad (möglicherweise GoodReader) zu synchronisieren, aber dies kann bei großen PDF-Dateien zu unpraktisch sein.
Antworten:
In seinem wenig bekannten Roman PDF Karenina schrieb Leo Tolstoi:
Es ist für niemanden schwer zu beantworten, warum Ihre PDF-Dateien größer sind, nachdem Preview sie geändert hat. Eine PDF-Datei besteht aus vielen verschiedenen Arten von Daten: Bildern, Inhaltsströmen, Schriftarten, Dokument-Overhead, Farbräumen, erweiterten Grafikzuständen und einer Querverweistabelle. Genauso wie ein Satz kurz und ein anderer ausführlich sein mag, aber beide gültiges Englisch sind und dasselbe sagen, kann auch eine PDF-Datei ausführlicher den gleichen Inhalt wie eine ausführlichere PDF-Datei darstellen. Wir müssten uns Ihre genauen PDF-Dateien ansehen. Es ist wahrscheinlich, dass sie von einer Vielzahl verschiedener Softwareteile erstellt wurden, einige davon sind konsistent, andere weniger.
Es ist auch wichtig, welche Version von Mac OS X und Preview Sie verwenden, da dies die Software bestimmt, mit der die neue PDF-Datei beim Speichern unter in der Vorschau geschrieben wird.
Ich kann Ihnen jedoch sagen, was an einigen meiner PDF-Dateien größer wird . Diese Geschichte gilt für meinen Computer, auf dem Mac OS X 10.5.8 und Apple Preview 4.2 (469.5) ausgeführt werden.
Eine Datei
Giulio.pdf
ist ein 22-seitiges Dokument mit Text als Text und nicht gescannten Bildern. Es ist 461.092 Bytes groß. Ich habe es in der Vorschau geöffnet, Datei ... Speichern unter ... ausgeführt und es unter einem neuen Dateinamen gespeichert. Die neue Datei ist 724.421 Bytes oder 57% größer.Ich habe jede Datei mit Adobe Acrobat Professional, Version 8.3.1 für Mac OS, geöffnet. Ich habe Advanced ... PDF Optimizer ... Audit Space Usage ... durchgeführt . In einem kleinen Dialogfeld wurde angegeben, wie viele Bytes für jede Verwendungskategorie anfielen, zuzüglich des Prozentsatzes der Gesamtdateigröße für die Kategorie.
Das Original
Giulio.pdf
enthält 390.754 Byte (84,75%) für Inhaltsströme und null Byte für Bilder. Es liegt im PDF 1.4-Format vor. Die von Preview gespeicherte Datei enthält 675.846 Byte (93,29%) für Inhaltsströme sowie null Byte für Bilder und ist im PDF 1.3-Format. Die Vorschau vergrößerte die Inhaltsströme um 285.092 Bytes, was 73% der Dateigrößenunterschiede zwischen den beiden entspricht.Ich fragte mich, ob das PDF 1.3-Dateiformat für das Speichern dieser Art von Datei von Natur aus weniger effizient war. Ich habe das Original
Giulio.pdf
in Adobe Acrobat Professional 8 geöffnet und Advanced ... PDF Optimizer ... Make compatible with: Acrobat 3.0 und höher ausgeführt und auf OK geklickt. Ich habe die resultierende Datei unter einem neuen Namen gespeichert. Die resultierende Datei hat das PDF 1.3-Format und war 452.356 Byte oder kleiner als das Original. Seine Inhaltsströme sind 375.171 Bytes (82,94%), ein ähnlicher Anteil, aber kleiner als die Inhaltsströme der Originaldatei.Aus diesem Grund können wir den Schluss ziehen, dass die Preview-App unter Mac OS X 10.5.8 nicht so effizient ist wie einige andere PDF-Ersteller, um prägnante Inhaltsströme in PDF-Dateien zu erstellen, und der Unterschied reicht aus, um drei Viertel des Größenunterschieds auszugleichen in einer PDF-Datei ohne Bilder.
Ich habe ein ähnliches Experiment mit
form k.pdf
einem einseitigen Dokument durchgeführt, das vom Papier gescannt wurde. Die Originaldatei enthält 303.730 Bytes, von denen 298.197 Bytes (98,18%) Bilder sind. Eine Kopie dieser Datei, die in der Vorschau mit Speichern unter ... erstellt wurde, ist 300.601 Byte groß oder 1% kleiner. Dieser Unterschied in der Dateigröße wird durch eine kleinere Kategorie von Bytes mit "Dokument-Overhead" in der von Preview erstellten Datei mehr als berücksichtigt.Aus diesem Grund können wir auch den Schluss ziehen, dass die PDF-Datei in der Vorschau nicht immer größer wird. Dies hängt von der Art der ursprünglichen PDF-Datei ab und davon, wie kurz sie zu Beginn war.
quelle
Ich weiß, dass dies ziemlich spät ist, aber ich habe etwas gefunden, das zu funktionieren scheint, zumindest wenn es anfänglich verwendet wird: Ich habe versucht, den Quarzfilter zu verwenden, um die Dateigröße zu reduzieren. Es scheint zu funktionieren, ist aber nicht standardmäßig aktiviert. Ich kann es speziell über das Menü Speichern unter auswählen (Option gedrückt halten), befürchte jedoch, dass die Standardmethode für die automatischen Speichervorgänge verwendet wird.
Hier ist, was für mich passiert und wie ich überhaupt zu dieser Seite gekommen bin: Die PDF-Datei beginnt mit einem Buch mit 91 MB und 900 Seiten. Ich füge eine einzelne Anmerkung hinzu und speichere sie, und die Datei springt auf 2,29 GB hoch. Um das Ganze abzurunden, dauert das Speichern ewig, besonders da ich auf einem externen Laufwerk speichere. Gott sei Dank ist das Laufwerk USB 3!
Gibt es sowieso diese Annotationen zu extrahieren? Ich kann auf meinem iPad auf Goodreader und PDF Expert Anmerkungen und Hervorhebungen erstellen. Wenn Preview dies auf meinem Computer nicht zulässt, gibt es eine andere App, die dies zulässt? Warum kann es nicht einfach die Anmerkungen / Hervorhebungen speichern, aber nicht versuchen, alle Bilder neu zu komprimieren, als würde ich jedes Mal ein JPEG neu speichern? Danke für die Hilfe!
quelle
Das Problem bleibt ernst. In Preview 7.0 (Mac OS 10.9.5.) Habe ich mit Acrobat 9.5.5 ein PDF erstellt. das führte zu einer 5 MB-Datei. In der Vorschau habe ich genau 12 Zeichen hinzugefügt (mit den Bearbeitungswerkzeugen). Nachdem diese Datei gespeichert wurde, wurde sie auf 14 MB erweitert.
Sie können das Problem beheben, indem Sie es in Acrobat öffnen und erneut speichern (möglicherweise müssen Sie die Option "Dateigröße reduzieren" verwenden).
quelle
Der Lösung können keine Hinweise hinzugefügt werden. Ich kann ein ähnliches Szenario hinzufügen (OS X 10.11.3): Ein gescanntes PDF mit einem Gewicht von ~ 800 KB wird in der Vorschau geöffnet, ein paar leere gescannte Seiten werden gelöscht. Das resultierende, zwei Seiten kürzere PDF ist ~ 2,2 MB groß. "Option-Speichern unter" und Auswahl des Quarzfilters "Dateigröße reduzieren" komprimieren die Datei auf ... 1,9 MB.
Die Originaldatei wurde mit einem Xerox WC 7830-Kopierer erstellt, der meiner Erfahrung nach (im Vergleich zu früheren Multifunktionsdruckern / -kopierern) recht gut optimierte gescannte PDFs erzeugt.
Kann keinen Unterschied in der Datei sehen, visuell; Ich würde vermuten, dass die Seitenbilder in 24bpp neu komprimiert werden, während die Originaldatei deutlich weniger Farbtiefe verwendet, wahrscheinlich 6-Bit (es ist ein gedrucktes und signiertes Dokument, nur Text, der Scanner macht einen guten Job bei der Aufbewahrung der weißer Hintergrund reines Weiß). Leider ist Preview nicht clever genug, um dies zu erkennen und aufrechtzuerhalten, und es scheint, dass die gesamte Datei erneut komprimiert werden muss, obwohl auf den verbleibenden Seiten keine Änderungen vorgenommen wurden (auch hier wurden nur einige Seiten gelöscht).
quelle