Ich habe ein einfaches MS Word-Dokument erstellt, das nur diesen Satz enthält:
Dies ist ein kleines Dokument.
Nichts anderes. Dann habe ich dieses Dokument als DOCX und als PDF gespeichert. Hier sind die Dateigrößen:
DOCX: 12 kB
PDF: 89 kB
Dieser Unterschied ist technisch gesehen riesig und stört mich sehr, wenn hauptsächlich Textdokumente mit Dutzenden von KB in DOCX anfangen, PDFs mit einer Größe von Hunderten von KB zu erstellen. Was ist so ineffizient am PDF-Format? Oder verwendet nur Word einen schrecklichen Ausgabealgorithmus?
Übrigens wurden die PDF-Ausgabeeinstellungen so festgelegt, dass die kleinstmögliche Datei erstellt wird:
microsoft-word
pdf
docx
Borek Bernard
quelle
quelle
Antworten:
Wenn Sie das PDF in Notepad ++ öffnen, finden Sie:
und auf dieses Objekt wird hier am Ende der Anweisung / FontFile2 verwiesen:
Die vom Word-Dokument verwendeten Schriftarten werden in die PDF-Datei eingebettet, sodass die PDF-Datei in sich geschlossen ist.
Ich habe dieses Dia-Deck verwendet , um die PDF-Anweisungen zu entschlüsseln.
Wenn Sie verhindern möchten, dass die Schriftarten in die PDF-Datei eingebettet werden, stellen Sie sicher, dass in Ihrem Word-Dokument eine der 14 in PDF-Viewern verfügbaren Standardschriftarten verwendet wird (Quelle Wikipedia ).
quelle
Das ist mir in Microsoft Word schon oft passiert, als ich versucht habe, ein einfaches Manuskript als PDF zu exportieren. Ein 5- bis 8-seitiges Word-Dokument mit einer Größe von ca. 50 KB wird zu einer PDF-Datei mit mehr als 10 MB, die viel zu groß ist, um eine E-Mail an jemanden zu senden.
Renes Antwort ist auf dem richtigen Weg - das Problem ist, dass Schriftarten in das Dokument eingebettet werden -, aber die Verwendung einer der Standardschriftarten wird das Problem nicht unbedingt lösen.
Alle meine Dokumente befanden sich in Times New Roman und benutzten nichts Schöneres als Fettdruck und Kursivschrift. Zumindest dachte ich. Es stellt sich heraus, dass ich in meiner Standardvorlage das automatische Kerning aktiviert habe (aus offensichtlichen Gründen ). Beim Exportieren in PDF hat Word tatsächlich jede dieser Ligaturen als separates Schriftartobjekt in das Dokument eingebettet und es so unglaublich aufgebläht.
Das Update ist einfach, Sie müssen nur daran denken, es jedes Mal zu tun:
Interessanterweise können Sie Ligaturen, kontextbezogene Alternativen und andere erweiterte Typografiefunktionen aktiviert lassen. Sie haben keinen erkennbaren Einfluss auf die Größe der resultierenden PDF-Datei.
Exportieren Sie das Dokument erneut als PDF, und es ist ungefähr 100 KB groß. Leider ist das Kerning unterdurchschnittlich, daher würde ich das Drucken nicht empfehlen, aber es funktioniert einwandfrei zum Versenden eines Dokuments per E-Mail.
quelle
Eine weniger technische Antwort könnte darin bestehen, dass PDF-Dateien Vektoren (dh mathematische Gleichungen) verwenden, um alles zu beschreiben, was Sie sehen. Alle Kurven und Linien werden durch mathematische Gleichungen definiert. Daher müssen Sie eine Menge Informationen bereithalten, insbesondere, wenn Ihre Dokumente Bilder enthalten.
Dies hat den Vorteil, dass Sie theoretisch unendlich nah zoomen können, ohne an Auflösung oder Details zu verlieren, da die Linien und Kurven keine Breite haben und daher mit Ihrem Zoom skaliert werden können.
Genau wie durch die kürzliche Änderung der Google-Schriftart die Größe des Logos von ~ 14 KB auf ~ 300 KB verringert wurde, tragen einfachere Schriftarten wahrscheinlich dazu bei, die Dateigröße zu verringern.
quelle