Ich muss einige PDF-Dateien verarbeiten. Die Aufgabe besteht darin, eine bestimmte Bilddatei durch eine andere auszutauschen. Mein erstes Problem ist, wie man ein PDF-Bild über die Befehlszeile in einem Stapelprozess ersetzt. Als nächstes werde ich versuchen, andere Probleme zu lösen, z. B. zu ermitteln, welches Bild ersetzt werden muss (da die PDF-Dateien möglicherweise mehr als ein Bild enthalten). Aber zuerst möchte ich das erste Problem lösen: wie man ein Bild in einer PDF durch ein anderes ersetzt.
Ich habe über poppler-utils und pdftk gelesen, aber meines Wissens erlaubt keines dieser Tools das Ersetzen von Bildern in PDF.
command-line
pdf
images
Ivan
quelle
quelle
Antworten:
OK ... ich denke
pdflatex
ist das fehlende Stück hier.Das OP sagte, er habe in
poppler-utils
und untersuchtpdftk
. Lassen Sie mich noch etwas hinzufügenpdfimages
. Dies sind zusammen mitpdflatex
den Teilen einer Lösung.Im obigen Beispielcode werden die
pdfimages
Seiten 4 bis 20 vontarget.pdf
durchsucht und alle Bilder in Dateien mit beginnenden Namen extrahiertimageroot
.poppler-utils
bietetpdftotext
. Ich empfehle die-layout
Option, mit der das Dokument gut lesbar bleibt.Der Einwand des OP gegen die
imagemagick
von Pidosaurus angebotene Lösung besteht darin, dass ein Bild keinen extrahierbaren Text enthält. Mit den von mir beschriebenen Dienstprogrammen verfügt das OP nun über alle Bilder sowie den gesamten extrahierten Text, und Seitenzahlen und Inhalte bleiben bei der-layout
Option erhalten. Das OP könnte die richtige Textseite identifizieren und in eine.tex
Datei einfügen, die mit einer%includegraphics
Anweisung endet und auf das Ersatzbild mit dem Dateinamen verweist. Sie erhalten dannpdflatex
diese und erhalten eine neue einseitige PDF-Datei, die Sie in den Rest Ihres Dokuments einfügen könnenpdftk
. Wenn Sie wissen, wo%includegraphics [h]
sich das Bild im Text der Originalseite befindet, können Sie das Bild genau an der richtigen Stelle platzieren.quelle