Interne PDF-Struktur durchsuchen

18

Durchsuchen der internen PDF-Struktur in Adobe 9.0

Ich habe das erweiterte Menü mit dieser Option nicht gefunden.

Kann mir jemand helfen?


quelle

Antworten:

23

Es gibt verschiedene Möglichkeiten, die interne Struktur einer PDF-Datei zu durchsuchen.

Pdfs sind irgendwie menschlich lesbar

Abgesehen von Sicherheitspasswörtern ist ein Großteil davon für Menschen lesbar. Wenn ein PDF ein Kennwort hat, sind alle Zeichenfolgen und Streams (die bereits komprimiert sind, kein Verlust) Pseudozufallsmüll. Komprimierte Datenströme gibt es zuhauf, aber in Ihrem bevorzugten Texteditor sieht vieles so aus:

2 0 obj
<< /Type /Page 
   /MediaBox [0 0 612 792]
   /Contents 4 0 R
   /Resources << /Fonts 
     << /F1 5 0 R>> 
   >>
>>
endobj

Warnung: Leerzeichen sind weitgehend irrelevant und werden normalerweise entfernt, wenn dies möglich ist. Ich habe das nur hübsch gemacht, um es ein bisschen leichter zu verstehen.

<< und >> beginnen und enden "Wörterbücher". Wörterbücher bestehen aus Schlüssel / Wert-Paaren. Der Schlüssel ist immer ein "Name": Alle Namen beginnen mit "/". Der Wert kann ein beliebiger Wert sein, einschließlich eines anderen Namens.

[ und ] beginnen und enden "Arrays". Arrays können aus fast allem bestehen.

Zahlen sind "Zahlen". Fließkomma oder anders.

() und <> beginnen und enden "Strings". <> Strings werden als Hex-Werte aufgelistet, () sind ANSI-Strings.

Pet Peeve: / Names und (Strings) verwenden völlig unterschiedliche Fluchtsysteme. Grr.

Indirekte Referenzen verweisen auf andere Objekte im PDF:
<objNum> <generationNum-AlwaysZero> R

Im obigen Beispielobjekt befindet sich der Inhaltsdatenstrom in Objekt 4 an einer anderen Stelle im PDF. Um es zu finden, können Sie die Textsuche Ihres Editors nach "N 0 obj" verwenden, wobei N die gewünschte Objektnummer ist.
WARNUNG: Eine PDF-Datei enthält Hunderte, möglicherweise Tausende von Objekten. Wenn Sie nach "1 0 obj" suchen, erhalten Sie VIELE Treffer.

Wenn Sie nach der internen Struktur fragen, wissen Sie das wahrscheinlich bereits. Andere, die dasselbe wissen wollen, wissen es vielleicht nicht.

WARNUNG: BEARBEITEN Sie eine PDF-Datei nicht in einem Texteditor. Alles, was mit Binärdateien zu tun hat, wird beschädigt. Byte-Offsets sind in PDF sehr wichtig.

Acrobat Plugin [s]

Es gibt ein Acrobat-Plugin namens PDF CanOpener von Windjack Solutions (keine Zugehörigkeit). Es ist SLICK. Sie können die PDF-Struktur als Baum durchsuchen, Inhaltsströme anzeigen (und ändern) und so weiter.

Apps von Drittanbietern

Viele. Viele Leute bauen eine als Teil des Lernens zum Parsen von PDF oder als Debugging-Tool. Sie sind ziemlich praktisch.

iText RUPS (Teil von iText, einer Java PDF-Bibliothek, jetzt auf GitHub)

PDF-Objektbrowser

PDF Vole

Mark Storer
quelle
1
PDF VoleVerbindung scheint jetzt unterbrochen zu sein ...
DNA
5
+1 für iText RUPS, nicht gerade ein freundliches GUI, aber funktioniert, übrigens derzeit scheint die Projekt-URL ( sourceforge.net/projects/itextrups )
Jaime Hablutzel
2
iText RUPS wurde hierher verschoben: github.com/itext/rups
bmaupin
1
Eine Kopie des pdfvole-Quellcodes finden Sie hier: github.com/Rossi1337/pdf_vole
yms
1
Wenn die PDF-Datei komprimierte Datenströme enthält, kann das Befehlszeilendienstprogramm qpdf diese dekodieren / entleeren und eine PDF-Datei mit verständlicheren Inhalten erstellen: pdf
skierpage 13.11.19
7

O2Solutions bietet ein MS Windows-kompatibles Dienstprogramm zum Anzeigen der internen Struktur von PDF-Dokumenten. Es ist kostenlos für den persönlichen und kommerziellen Gebrauch.

http://www.o2sol.com/pdfxplorer/overview.htm

AffineMesh
quelle
4

PoDoFoBrowser ist ein kleines kostenloses, portables Dienstprogramm, mit dem Sie nicht nur die interne PDF-Struktur durchsuchen, sondern auch Objektdaten exportieren, importieren und bearbeiten können. Es kann hier heruntergeladen werden:

http://sourceforge.net/projects/podofo/files/podofobrowser/0.5/

So sieht es unter Windows aus:

Bildschirmfoto

Alexey Popkov
quelle
2

Der kostenlose PDF-XChange Editor verfügt über ein Inhaltsfenster , in dem Sie die Baumstruktur der PDF-Datei anzeigen können.

View -> Panes -> Content
Hüseyin Yağlı
quelle
2

PDF Vole scheint kaputt zu sein. Wenn noch jemand nach einem Tool sucht, verwende ich den kostenlosen PDF Analyzer .

Bildbeschreibung hier eingeben

juFo
quelle