Bevor ich mit Ubuntu angefangen habe, habe ich Nitro PDF Reader verwendet, um Bilder automatisch aus PDF-Dateien zu extrahieren. Gibt es einen PDF-Reader für Linux, der dies tut?
Ich möchte Bilder schneller / einfacher extrahieren können als beim Aufnehmen eines Schnappschusses.
pdfimages
es besser / schlechter machen als NitroPDF?Antworten:
Verwenden
pdfimages
pdfimages
ist ein Tool zum Extrahieren von PDF-Bildern, mit dem Bilder in einer PDF-Datei in den Formaten PPM, PBM, JPEG oder JPEG 2000 gespeichert werden.Es ist ein Teil des
poppler-utils
Pakets, das Sie installieren müssen.Verwendungszweck:
pdfimages [options] <PDF-file> <image-root>
Beispiel: Im Folgenden werden alle Bilder aus einer PDF-Datei extrahiert und im JPEG-Format gespeichert.
Speichert Bilder aus PDF-Dateien
in.pdf
in Dateien/tmp/out-000.jpg
(oder/tmp/out-000.pbm
; siehe unten)/tmp/out-001.jpg
usw.Die pdfimages- Manpage erklärt:
quelle
-all Write JPEG, JPEG2000, JBIG2, and CCITT images in their native format. CMYK files are written as TIFF files. All other images are written as PNG files. This is equivalent to specifying the options -png -tiff -j -jp2 -jbig2 -ccitt.
-all
Schalter nur in den letzten Versionen von Poppler-Utils unterstützt wird. Wenn Sie beispielsweise noch am 12.04. Sind, können Sie nicht auf diese Option zugreifen-all
, wählen Sie die PNM-Formate. Sie sind verlustfrei und Sie können die Bilder zB in PNG nachbearbeiten.$ pdfimages -list <PDF-file>
um das Originalformat in der Spalte "enc" zu überprüfen, damit Sie das Bild nicht in ein anderes Format umcodieren müssen.Ich benutze oft Inkscape dafür. Lade die Seite und lösche alle anderen Sachen. Der Vorteil ist, dass Sie Vektorgrafiken in SVG abrufen und nach Belieben bearbeiten können.
quelle
Ich habe eine zweispaltige PDF-Datei mit eingebetteten Bildern, die mit LaTeX erstellt wurden, wobei die Originalbilder als EPS bereitgestellt wurden. Ich habe versucht, die vorgeschlagene Lösung basierend auf
pdfimages
, aber leider keine Bilder zurück. Ich habe damals versucht, Inkscape zu verwenden, aber die erzeugten SVG-Bilder waren verzerrt und ich hatte auch kein Glück, sie als EPS zu exportieren.Die Software, die für uns funktioniert hat, war der MasterPdfEditor .
Hier ist der Ablauf
Das Ergebnis ist von sehr hoher Qualität, aber die Software ist nicht kostenlos. Es gibt eine Demoversion, in der "alle Funktionen ausprobiert werden können", in der jedoch "ein Wasserzeichen für die Ausgabedatei hinzugefügt wird". Um ehrlich zu sein, habe ich kein Wasserzeichen im erstellten PDF bemerkt.
quelle
Sie können auch pdfmod ausprobieren. Es ist eine grafische Benutzeroberfläche, die Bilder extrahieren und andere grundlegende PDF-Manipulationen durchführen kann.
quelle
Wenn Sie ein zugeschnittenes Bild im PDF / EPS-Format benötigen, extrahieren Sie eine Seite mit dem Bild mithilfe von
pdfmod
(wie von Aufgabe vorgeschlagen).Wenn
pdfcrop
Sie es dann verwenden , können Sie es zuschneiden und die Ränder durch Ausprobieren richtig einstellen:quelle
Ich verwende pdfimages, ein Kommandozeilen-Tool, das für mich großartig funktioniert. Es ist sehr einfach zu bedienen und Sie können die Option --help verwenden, um mehr über die Verwendung zu erfahren. Ich benutze Ubuntu und es ist vorinstalliert. Wenn Ihre PDF-Dateien verschlüsselt oder kennwortgeschützt sind, gibt es dafür Optionen, sodass dieses Tool hervorragend funktioniert. Sie können lesen , mehr über pdfimages hier
quelle
Bei pdf-Bildern kann das extrahierte Bild aus zwei oder mehr Teilen bestehen. Ein einfacher Weg, sie wieder zusammenzusetzen, ohne sich um extrahierte Formate kümmern zu müssen, besteht darin, die Teile in LibreOffice Draw zu importieren, im Dialogfeld zum Zuschneiden von Bildern zuzuschneiden, die Teile zu positionieren, die Seitengröße anzupassen und in das von Ihnen bevorzugte Format zu exportieren.
quelle
Wenn Sie ein Bild aus einem PDF mit einem PDF-Viewer zuschneiden möchten, können Sie okular ausprobieren. Es kann alles (Texte oder Bilder) im PNG- oder JPEG-Format beschneiden. Wenn Sie Bilder im PNG-Format aus einem PDF extrahieren möchten, können Sie dies mit minimalem Befehl mit pdftohtml tun. Es konvertiert PDF in HTML und Bilder. Hier finden Sie ein Beispiel - https://www.youtube.com/watch?v=CG1rf7k3xo8 . Wenn Sie viele Bilder aus einem PDF extrahieren möchten, empfehle ich Ihnen, dies zu versuchen.
quelle
Verwendete Software: Xreader OS: Antergos
Schritte:
quelle