Angenommen, ich habe eine PDF-Datei und möchte alle für diese PDF-Datei verfügbaren Metadaten abrufen. Welches Dienstprogramm soll ich verwenden?
Ich finde, dass die Information, die mich normalerweise am meisten interessiert, das Papierformat ist, was PDF-Betrachter normalerweise nicht melden. Ist z. B. die PDF-Größe Letter, Legal, A4 oder etwas anderes? Aber auch die anderen verfügbaren Informationen könnten von Interesse sein.
BEARBEITEN: Hier finden Sie dank @terdon einen praktischen Leitfaden für Papierformate.
pdf
file-metadata
Faheem Mitha
quelle
quelle
Antworten:
Eines der kanonischen Werkzeuge dafür ist
pdfinfo
, wenn ich mich recht entsinne, xpdf. Beispielausgabe:quelle
pdfinfo
, um das aufzuheben.if ((fabs(w - 612) < 0.1 && fabs(h - 792) < 0.1) || (fabs(w - 792) < 0.1 && fabs(h - 612) < 0.1))
?sqrt(2)
s.Ein weiteres nützliches Werkzeug ist exiftool . Es ist möglicherweise nicht das richtige Tool für Ihren speziellen Fall, da es keine Informationen zur Geometrie des Dokuments enthält. Im Allgemeinen ist es jedoch wahrscheinlich das umfassendste Tool zum Überprüfen von PDF-Metadaten.
Hier ist ein Beispiel für einen Befehl, der alle verfügbaren Metainformationen (
-a
) nach Gruppen (-G1
) sortiert ausgibt :Die offizielle Dokumentation bietet einen Überblick über die unterstützten PDF-Tags:
Sie können exiftool unter Debian / Ubuntu installieren mit:
Wenn Sie mehr in die GUI-Seite der Dinge sind, können Sie mein Projekt PDFMtEd ausprobieren. Es handelt sich um eine Reihe von Werkzeugen, die als grafische Frontends für das Exiftool dienen und das Anzeigen und Bearbeiten von PDF-Metadaten ermöglichen.
Hier sind ein paar Screenshots:
quelle