Ermitteln von Metadaten zu einem PDF

32

Angenommen, ich habe eine PDF-Datei und möchte alle für diese PDF-Datei verfügbaren Metadaten abrufen. Welches Dienstprogramm soll ich verwenden?

Ich finde, dass die Information, die mich normalerweise am meisten interessiert, das Papierformat ist, was PDF-Betrachter normalerweise nicht melden. Ist z. B. die PDF-Größe Letter, Legal, A4 oder etwas anderes? Aber auch die anderen verfügbaren Informationen könnten von Interesse sein.

BEARBEITEN: Hier finden Sie dank @terdon einen praktischen Leitfaden für Papierformate.

Faheem Mitha
quelle
Seltsam. Warum hat jemand diese Frage abgelehnt? Möchtest du das erklären?
Faheem Mitha

Antworten:

39

Eines der kanonischen Werkzeuge dafür ist pdfinfo, wenn ich mich recht entsinne, xpdf. Beispielausgabe:

[0 1017 17:10:17] ~/temp % pdfinfo test.pdf
Creator:        TeX
Producer:       pdfTeX-1.40.14
CreationDate:   Sun May 18 09:53:06 2014
ModDate:        Sun May 18 09:53:06 2014
Tagged:         no
Form:           none
Pages:          1
Encrypted:      no
Page size:      595.276 x 841.89 pts (A4)
Page rot:       0
File size:      19700 bytes
Optimized:      no
PDF version:    1.5
Ulrich Schwarz
quelle
1
Zumindest in Debian ist dies Teil von Poppler-Utils. Ich habe eine Datei hier, die pdfinfo als 595,2 x 841,44 Punkte meldet. Dies wird jedoch nicht als A4 gemeldet. Was beschließt, es als A4 zu markieren?
Faheem Mitha
2
Die Namen sind fest codiert : Der Buchstabe ist 612 ± 0,1 x 792 ± 0,1, die magischen Größen für DIN / ISO A sind (alle ± 1 pt): 3370,98, 2383,64, 1685,49, 1191,82, 842,74, 595,91, ..., so scheint es Ihre Seite ist ein kleines bisschen zu schmal pdfinfo, um das aufzuheben.
Ulrich Schwarz
Ich verstehe, das bisschen Code if ((fabs(w - 612) < 0.1 && fabs(h - 792) < 0.1) || (fabs(w - 792) < 0.1 && fabs(h - 612) < 0.1))?
Faheem Mitha
Das ist Brief, die A-Formate sind in der Schleife mit dem sqrt(2)s.
Ulrich Schwarz
13

Ein weiteres nützliches Werkzeug ist exiftool . Es ist möglicherweise nicht das richtige Tool für Ihren speziellen Fall, da es keine Informationen zur Geometrie des Dokuments enthält. Im Allgemeinen ist es jedoch wahrscheinlich das umfassendste Tool zum Überprüfen von PDF-Metadaten.

Hier ist ein Beispiel für einen Befehl, der alle verfügbaren Metainformationen ( -a) nach Gruppen ( -G1) sortiert ausgibt :

exiftool -a -G1 "$File"

Die offizielle Dokumentation bietet einen Überblick über die unterstützten PDF-Tags:

Sie können exiftool unter Debian / Ubuntu installieren mit:

sudo apt-get install libimage-exiftool-perl

Wenn Sie mehr in die GUI-Seite der Dinge sind, können Sie mein Projekt PDFMtEd ausprobieren. Es handelt sich um eine Reihe von Werkzeugen, die als grafische Frontends für das Exiftool dienen und das Anzeigen und Bearbeiten von PDF-Metadaten ermöglichen.

Hier sind ein paar Screenshots:

Bildbeschreibung hier eingeben

Bildbeschreibung hier eingeben

Glutanimate
quelle