Ich habe das Problem, dass einige Benutzer sehr große PDFs erstellen. Andererseits habe ich PDF-Dateien von unseren Faxgeräten gesendet, die sehr klein und vollständig druckbar sind. Meine Frage ist
- Gibt es eine Möglichkeit, die Auflösung (DPI) des PDF zu finden? Ich suche im Internet, konnte keine Antwort finden. Überprüfte die Eigenschaften der Datei, diese Informationen wurden dort zumindest in meinem Fall nicht gespeichert.
- Was ist die optimale Auflösung für die Konvertierung von Textdateien in Bild-PDF. 96 dpi, 300 dpi oder mehr?
- Lustige Frage. Kann ich die Größe einer PDF-Datei, die mit hoher Auflösung gescannt wurde, in eine kleinere Auflösung ändern?
Ich weiß, dass einige Antworten möglicherweise nicht verfügbar sind, da ich bereits im Internet gesucht und keine Antworten gefunden habe.
Hinweis: Meine PDF-Dateien bestehen ausschließlich aus Bildern, Text zu Bildern. Ich bin auch mit primoPDF (kostenlos) vertraut, mit dem man experimentieren kann
quelle
Ich weiß, dass Sie die Bilddaten nicht extrahieren möchten, aber dies ist wahrscheinlich der einzige Weg, um die ursprüngliche Auflösung herauszufinden.
Unter * nix, wenn Sie ImageMagick's
identify
und Xpdf installiert haben 1 :Wo
test.pdf
ist Ihre Eingabe PDF. Die Ausgabedateien werden geschriebentest-000.jpg
,test-001.jpg
und so weiter. Dies würde Ihnen die Originalgröße aller enthaltenen Bilder dieses PDF 2 geben .Beispielausgabe für eine PDF-Datei, die nur ein großes Bild enthält:
1) Windows hat diese auch, aber das Skript wäre natürlich anders.
2) Beachten Sie, dass Bilder keine DPI-Informationen enthalten. Einfach ausgedrückt: Dies wird nur zum Drucken verwendet, und Bilder benötigen kein inhärentes Maß für die DPI.
Im Allgemeinen sollte alles, was Sie drucken möchten, 300 dpi oder mehr betragen. Die meisten Drucker verarbeiten auch eine höhere Auflösung.
quelle
pdfimages -list test.pdf
. Anstatt Dateien auszugeben, werden Größe und Bildtyp aufgelistet. Gibt Ihnen immer noch keine explizite Auflösung, vermeidet jedoch das Erstellen von Ausgabedateien.pdfimages -list
bietet explizitx-ppi
undy-ppi
sowie viele andere Informationen.pdfimages
ziemlich falsch sein kann (z. B. wenn das Bild in einem von produzierten PDF größer als sein sichtbarer Bereich istscribus
). (Leider habe ich jetzt wirklich keine Zeit, einen Fehlerbericht einzureichen.)Aus irgendeinem Grund ist die neueste Version von pdfimages, die ich in meinem CentOS aktualisieren kann, Version 3.04.
Daher habe ich nicht die Option -list, wie in den vorherigen Antworten angegeben. Das aus PDF-Bildern erstellte Testbild, das auf der Antwort von slhck basiert, enthält jedoch die gewünschte Antwort!
identifiziere -verbose test-0000.jpg | Mehr
Daher wird die dpi in der 6. Zeile explizit mit der Option -verbose im Befehl identify angezeigt.
Die Antwort von slhck kann also wie folgt geändert werden.
pdfimages -j test.pdf test && für Datei in $ (find. -name "test * .jpg"); identifiziere -verbose "$ file" | awk 'NR == 6'; erledigt
In einem anderen Punkt habe ich versucht zu rennen
identifiziere -verbose test.pdf
Es scheint, dass Imagemagick immer 72 dpi annimmt und die hier gedruckten Informationen daher falsch zu sein scheinen.
quelle
Eine PDF-Datei hat keine inhärente Auflösung. Jedes darin enthaltene Rasterbild (falls vorhanden) hat eine eigene Auflösung. Ich kenne keine einfache Möglichkeit, eine einzelne Zahl für die mittlere / modale Auflösung von XObjects mit eingebettetem Bild zu extrahieren.
quelle
Dies funktionierte mit einem PDF, das aus einem Kyocera-MFP generiert wurde ... Dies gilt wahrscheinlich nur für ganzseitige Bilder wie Scans.
Datei> Eigenschaften - Registerkarte "Beschreibung" - Seitengröße. In meinem Beispiel stand 8,5 x 11,0 Zoll.
Öffnen Sie das PDF mit einem Texteditor (Notizblock), suchen Sie nach
/width
und/height
Beispiel:
Mein PDF wurde mit einer Auflösung von 600 x 600 gescannt.
Sie können die ersten beiden Schritte überspringen, wenn Sie die Dokumentgröße kennen (normalerweise ist A4 8,27 x 11,69).
quelle
Um Ihren zweiten Punkt zu beantworten: Zusätzlich zu @slhcks Erwähnung von Drucker-dpi ist 300 dpi auch die typische empfohlene Mindestanzahl für OCR mit Schriftgrößen von 10 + pt.
Darüber hinaus hat ein moderner 15 "4K-Laptop-Bildschirm nur etwa 280PPi. Wenn Sie also einen gesamten A4 auf dem Bildschirm (Querformat) anzeigen möchten, ist es nicht sinnvoll, mit mehr als ~ 320 dpi zu scannen, da jedes Dokument höher ist verkleinert. Natürlich spielt dies keine Rolle, wenn Sie zoomen möchten, dann benötigen Sie möglicherweise eine höhere Auflösung.
Um Ihre beiden anderen Punkte zu beantworten, können Sie heutzutage zumindest Acrobat Pro verwenden, um die Bild-DPI und -Auflösung zu überprüfen, und Sie können sie auch bearbeiten.
quelle