Wie speichere ich eine Bild-PDF-Datei als Bild?

33

Ich habe eine PDF-Datei, die ein Scanbild eines Dokuments enthält. Ich möchte den Inhalt dieser PDF-Datei als Bild speichern, damit ich sie dann über ein OCR-Programm ausführen kann, das nur Dateien vom Typ .jpg, .png und .gif akzeptiert.

Wie speichere / konvertiere ich diese PDF in eines dieser Bildformate?

BEARBEITEN: Eine Möglichkeit, dies zu tun, besteht darin, auf jede Seite zu klicken. In die Zwischenablage kopieren. In Paint.net einfügen und dann speichern. Dies ist jedoch umständlich, da Sie in Acrobat Reader immer nur eine Seite auswählen können.

Kerl
quelle

Antworten:

20

Bitte achten Sie genau auf die Antwort von Pooryorick , in der er darauf hinweist, dass die Antwort von Sleske tatsächlich eine viel bessere Antwort für dieses spezielle Problem ist.


Verwenden Sie GhostScript . Dieser Befehl funktioniert für mich:

gs -dBATCH -dNOPAUSE -sDEVICE=png16m -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -r150 -sOutputFile=output%d.png input.pdf

Es gibt mehrere Png-Pseudo-Geräte, die sich in der Farbtiefe unterscheiden: Pngmono, Pnggray, Png16, Png256, Png16m und Pnggalpha. Wählen Sie, was am besten zu Ihnen passt.

Sie können auch JPEG verwenden, aber wenn Sie kein Problem mit dem Festplattenspeicher haben, möchten Sie eine so hohe Qualität, wie Sie sie für Ihre OCR-Funktion verwalten können, und das ist kein JPEG.

GhostScript unterstützt GIF nicht mehr, aber ich kann mir nicht vorstellen, warum Sie das brauchen, was mit der Unterstützung von PNG256.

wfaulk
quelle
Ich liebe GhostScript, und wenn Sie die Bequemlichkeit einer GUI zum Einstellen von Optionen, Anzeigen usw. möchten, versuchen Sie GSview pages.cs.wisc.edu/~ghost/gsview
Dennis
Wird die Ausgabe ein großes Bild sein?
Xonatron
1
@Xonatron: Nein. Ein Bild pro Seite. Der %dName der Ausgabedatei ist eine Variable, die durch die Seitenzahl ersetzt wird. (Mit
ziemlicher
20

Installieren Sie Imagemagick . Öffnen Sie ein Cmd-Fenster oder ein Terminal:

convert myfile.pdf myfile.jpg

Die Ausgabe ist 1 JPG-Datei für jede Seite in Ihrem PDF, Test-0.jpg, Test-1.jpg, etc.

DaveParillo
quelle
+1 für ImageMagick, aber -2 für den Vorschlag für den falschen Job. JPEG ist gut für Fotos, aber es ist das schlechteste Format, wenn Sie scharfe Kanten und hohe Kontraste haben (wie Sie es normalerweise bei schwarzem Text / Zeichen auf weißem Hintergrund tun). ImageMagick erledigt auch nicht die Konvertierungsarbeit selbst, sondern verwendet Ghostscript im Hintergrund als "Stellvertreter" -Slave. Wenn Sie dies also direkt mit Ghostscript tun, haben Sie mehr Kontrolle über die verwendeten Parameter. Und dann wähle TIFF (nicht JPEG) als Ausgabeformat, um Himmels willen!
Kurt Pfeifle
1
Hinweis: Stellen Sie unter Windows sicher, dass Sie zuerst Ghostscript 32-Bit installieren.
User
2
Achten Sie auf das density, depthund qualityFlags, die Ihnen bei der Optimierung Ihrer Ausgabe helfen können. Zum Beispiel: convert -density 300 -depth 8 -quality 85 a.pdf a.png Weitere Informationen
Nick
13

Es gibt auch pdfimagesvon den Xpdf-Tools (verfügbar auf der Website von XpdfReader ). Es wird nicht eine ganze PDF-Seite in ein Bild konvertiert, sondern es werden eingebettete Bilder aus einem PDF extrahiert .

Dies ist nützlich, wenn das PDF Text und Bilder enthält und Sie nur die Bilder möchten. Außerdem werden die Bilder im Originalformat extrahiert, so dass keine Qualitätsverluste auftreten (im Gegensatz zu Programmen, die die gesamte Seite rendern und anschließend in z. B. JPEG konvertieren). Abhängig von Ihren Bedürfnissen kann dies hilfreich sein.


Einfache Bedienung:

pdfimages -j -list mydocument.pdf mydocument-images

Dies wird die Eingabedatei lesen mydocument.pdf, extrahieren Sie alle Bilder und schreibt sie in einzelne Dateien mit dem Namen mydocument-images-0000.jpg, mydocument-images-0001.jpgusw.

Mit der Option werden -jeingebettete JPEG-komprimierte Bilder als JPEG-Dateien geschrieben, nicht als PBM- / PGM- / PPM-Dateien (die nicht komprimiert und riesig sind). Beachten Sie, dass Bilder möglicherweise weiterhin als PBM- / PGM- / PPM-Dateien geschrieben werden, wenn sie so in der PDF-Eingabedatei gespeichert wurden.

sleske
quelle
Als Referenz einfache Bedienung ist pdfimages -j "yourinputfile.pdf" "outputimages"die „outputimages-0000.ppm“ machen (oder „outputimages-0000.jpg“ , wenn sie das richtige Format sind). .NET-Beispiele können von hier oder hier
drzaus
Eine Einschränkung ist, dass die Datei möglicherweise nicht als JPG, sondern als PPM
gespeichert werden kann
11

Sie können dies mit Adobe Reader tun:

  1. Klicken Sie auf das Bild. Es wird hervorgehoben.
  2. Kopiere (Strg-C) und füge es in Paint ein.
  3. Speichern Sie den Dateityp wie Sie möchten.
Hemant
quelle
2
Interessanterweise verfügt Adobe Reader über eine Einstellung zum Überschreiben der mit dem Schnappschuss-Werkzeug aufgenommenen Bilder in dpi. Bei einer Einstellung von 300 dpi erhalten Sie druckfertige Schnappschüsse (standardmäßig wird die Bildschirmauflösung verwendet, die im Allgemeinen zu niedrig ist für andere Arbeiten wiederverwenden)
Stijn Sanders
3
+1 zur Vereinfachung. Die meisten PDF-Reader ermöglichen dies.
Decio Lira
4
Was passiert, wenn Ihr PDF 10000 Bildseiten enthält? Musst du das 10000 mal machen?
Guy
9

Mit Ausnahme der Antwort, in der pdf-Bilder erwähnt werden, wird in allen anderen Antworten nicht erwähnt, dass ihre Lösungen die eingebetteten Bilder tatsächlich transkodieren. Das heißt, diese Lösungen extrahieren nicht einfach das Originalbild, sondern modifizieren es, möglicherweise zum Nachteil des Bildes, während des Vorgangs. Nur pdfimages extrahiert das Originalbild. Dies gilt für Ghostscript, Imagemagick, Adobe Reader, PDFFill, den PDF Xchange Viewer, die OS X-Vorschau und die meisten anderen PDF-Programme.

Pooryorick
quelle
In Anbetracht des Kontextes der Frage ist dies tatsächlich ein sehr guter Punkt.
Wfaulk
FWIW, "PDFill PDF Tools" ermöglicht es Ihnen, die DPI für das Speichern als Bild einzustellen, sehr praktisch. So wird jede Seite (beginnend mit Text, Bildern, beliebigen Objekten) beispielsweise in einem hochauflösenden PNG mit 4961 x 6520 gespeichert.
Chris O
4

PDFill PDF Tools ist wahrscheinlich der einfachste Weg, um Ihre PDFs in Bilder unter Windows zu konvertieren. Damit können Sie alle Seiten in der PDF-Datei exportieren, um Bilder auf einmal zu trennen. Es stehen auch viele andere Funktionen kostenlos zur Verfügung, die nur in anderen PDF-Viewern verfügbar sind, wenn Sie die kommerzielle oder "Pro" -Version erwerben.

Verwenden Sie die Schaltfläche "PDF in Bilder konvertieren" (Schaltfläche 10) in der Abbildung unten.

PDFill PDF Tools Bildschirmfoto

Wenn Sie die Bilder zu einem sehr großen Bild verketten müssen, damit Sie Ihrem OCR-Programm nur eine Datei zuführen müssen, können Sie IrfanView verwenden

rauben
quelle
Beachten Sie, dass dadurch zwei verschiedene Tools auf Ihrem System installiert werden. Der wichtigste ist der PDFill Editor, den Sie nicht benötigen. Gehen Sie in das Startmenü, um dieses zu öffnen. Ich wurde durch den Screenshot gerettet, als mir klar wurde, dass etwas nicht stimmte, bevor ich deinstallierte.
Ufotds
Ja, ich habe wohl nicht erwähnt, dass damit auch eine Shareware-Version von PDFill Editor sowie ein PDF-Drucker installiert werden. Mit PDFill Editor erstellte Dateien haben ein Wasserzeichen, es sei denn, Sie erwerben den Editor für 19,99 USD. Für das Dienstprogramm PDFill PDF Tools Free ist jedoch kein Kauf erforderlich. In der vorliegenden Version können Sie PDFill Editor nicht deinstallieren, ohne auch PDFill PDF Tools Free deinstalliert zu haben, aber die Installation von PDFill Editor schadet nichts.
Rob
2

Da Sie kein OS-Tag eingefügt haben, werde ich eine OSX-Antwort einfügen:

PDFs werden standardmäßig in Preview.app geöffnet, sodass Sie Folgendes verwenden können File -> Save-As:

  • GIF
  • ICNS
  • JPEG
  • JPEG-2000
  • BMP
  • OpenEXR
  • Photoshop
  • PNG
  • TGA
  • TIFF
See
quelle
1

Auch PDF Xchange Viewer (kostenlos) exportiert in eine Datei. Datei → Exportieren → In Bild exportieren.

Nicht nur das, aber ich denke, es ist der beste kostenlose PDF-Viewer für Windows, und es hat einige nette Markup-Funktionen. Ich habe eine Lizenz für Adobe Acrobat und bevorzuge diese weiterhin, es sei denn, ich bearbeite sie ausführlich, was selten der Fall ist.

wfaulk
quelle
Dies sah vielversprechend aus, bis ich feststellte, dass die Option zum Exportieren in ein Bild für kennwortgeschützte PDF-Dateien deaktiviert ist.
Mitch
1

(Nicht kostenlos) Acrobat Professional führt Folgendes aus:

Erweitert-> Dokumentverarbeitung-> Alle Bilder exportieren ...

ufotds
quelle
0

Wenn die Datei weniger als 5 MB groß ist und Sie sich keine Sorgen um den Datenschutz / die Vertraulichkeit machen, können Sie über einen praktischen Onlinedienst unter http://www.go2convert.com/ viele Grafikkonvertierungen vornehmen (einschließlich PDF in JPEG).

sgmoore
quelle
Gerade versucht und es gab diese Fehlermeldung "Sorry! Dieses Bild konnte nicht korrekt konvertiert werden."
Guy
-1

Wenn das Bild die Größe Ihres Bildschirms überschreitet, können Sie FastStone Capture (die Funktion "Bildlauffenster erfassen") verwenden und das Bild als JPEG speichern.

Alt-Text

Gaff
quelle
Das ist ein sehr umständlicher Weg, ein Bild aufzunehmen. OP hat bereits eine bessere Lösung (Seite in Acrobat markieren).
sleske