Ich habe ein ziemlich großes (~ 100 MB) PDF-Dokument mit vielen Bildern (als Illustrationen und Hintergrundbilder), und ich hätte gerne eine Kopie dieses PDFs ohne Bilder, kann aber nicht herausfinden, wie TU das.
Ich spreche nicht davon, es nur in Text zu konvertieren. Ich möchte Absätze / Tabellen / Mehrspalten so lassen, wie sie sind.
Ich bin mit der Befehlszeile vertraut und habe mehrere Computer mit unterschiedlichen Distributionen, die ich verwenden kann.
command-line
pdf
Ornux
quelle
quelle
Antworten:
Es befindet sich nicht in den Repositories, aber Sie können einen Download ( vorkompiliert oder Quellcode ) auf deren Website finden .
Handbuch :
quelle
Die neuesten Versionen von Ghostscript können dies auch. Fügen Sie einfach den Parameter
-dFILTERIMAGE
zu Ihrem Befehl hinzu.Es gibt noch zwei weitere neue Parameter, die hinzugefügt werden können, um die Inhaltstypen "Vektor" und "Text" selektiv zu entfernen :
-dFILTERIMAGE
: Erzeugt eine Ausgabe, bei der alle Rasterbilder entfernt werden.-dFILTERTEXT
: Erzeugt eine Ausgabe, bei der alle Textelemente entfernt werden.-dFILTERVECTOR
: Erzeugt eine Ausgabe, bei der alle Vektorzeichnungen entfernt werden.Zwei dieser Optionen können kombiniert werden. (Wenn Sie alle 3 kombinieren, werden alle Seiten ausgeblendet ...)
Beispiele
Hier ist der Screenshot einer Beispiel-PDF-Seite, die alle drei oben genannten Arten von Inhalten enthält:
Screenshot der ursprünglichen PDF-Seite mit "Bild" -, "Vektor" - und "Text" -Elementen.
Durch Ausführen der folgenden 6 Befehle werden alle 6 möglichen Variationen des verbleibenden Inhalts erstellt:
Das folgende Bild zeigt die Ergebnisse:
Obere Reihe von links: Der gesamte "Text" wurde entfernt. alle "Bilder" entfernt; Alle "Vektoren" entfernt. Untere Reihe, von links: nur "Text" bleibt erhalten; nur "Bilder" bleiben erhalten; nur "Vektoren" werden beibehalten.
quelle
Während @Rinzwind die richtige Antwort ist , möchte ich nur die "Midway" -Lösung kommentieren. Sie können in der Regel stark die Größe der Bilder reduzieren mit ghost mit
... es ist manchmal sehr praktisch zum Korrekturlesen. Die Handbuchseite zum Schreiben von PDF finden Sie hier .
quelle
/screen
(unter anderem) die Auflösung der Bitmap-Bilder auf 72 dpi. Also ja, wenn Sie Bilder mit kleinerer DPI haben, kann dies die Dateigröße erhöhen. Aus diesem Grund habe ich das Wort "normal" verwendet (im Sinne von "nicht immer, aber ziemlich oft"). Fühlen Sie sich frei, was Sie wollen, abzustimmen.for s in screen default ; do gs -o /dev/null -sDEVICE=pdfwrite -dPDFSETTINGS=/${s} -c "currentpagedevice {exch ==only ( ) print === } forall" | sort | tee ghostscript---pdfwrite-PDFSETTINGS-${s}--pagedevice-settings.txt; done
. Es werden zwei Textdateien erstellt, mit denen Sie vergleichen könnensdiff -sbB $[file1}.txt ${file2}.txt
. Jetzt wissen Sie genau und vollständig alle die verschiedenen Einstellungen eingeführt durch-dPDFSETTINGS=/screen
!/screen
als in/default
--- 72 dpi im Vergleich zu 150 dpi, optimiert, EPS-Vorschau verwerfen ... aber hey, kein großes Problem. Die Leute werden die bessere Lösung testen und auswählen./screen
gab wirklich schlechte Ergebnisse. Möglicherweise versagt mein Gedächtnis, oder ich habe es verwechselt/epub
. Das Kommando, das ich dir gab, war aus dem Gedächtnis, weil ich mir ziemlich sicher war, dass es zeigen würde, was ich meinte. Jetzt habe ich es erneut ausgeführt, ich sehe nicht mehr, was ich erwartet hatte: mehr erweiterte Tests, die ich vor einigen Jahren ausgeführt habe. Dann wurden viele (CID? / CFF?) Schriftarten gerastert, wodurch die Größe der resultierenden PDFs zunahm. Ich muss die Ausgabe noch einmal besuchen, wenn ich mehr Zeit habe ... :-)Sie können den Master-PDF-Editor verwenden, diese Bilder löschen und als neue PDF-Datei speichern. Sie können es vom Ubuntu Software Center herunterladen.
quelle