Ich suche ein gutes Programm, um mir die Unterschiede zwischen zwei ähnlichen PDF-Dateien zu zeigen. Insbesondere suche ich nach etwas, das nicht nur auf einer ASCII-Version (mit "pdftotext") der Dateien diff ausführt. Das macht pdfdiff.py .
39
Antworten:
Sie können dafür DiffPDF verwenden . Aus der Beschreibung:
quelle
sudo apt-get install diffpdf
.Ich habe gerade einen Hack herausgefunden, um DiffPDF (das von @qbi vorgeschlagene Programm) für mehr als kleine Änderungen nutzbar zu machen. Was ich tue, ist, alle Seiten pdfs mit pdfjam zu einer langen Schriftrolle zu verketten und dann die Schriftrollen zu vergleichen. Es funktioniert auch, wenn große Abschnitte entfernt oder eingefügt werden!
Hier ist ein Bash-Skript, das die Arbeit erledigt:
quelle
Auch wenn dies das Problem nicht direkt löst, ist dies eine gute Möglichkeit, alles mit wenigen Abhängigkeiten von der Kommandozeile aus zu erledigen:
https://linux.die.net/man/1/pdftotext
Es funktioniert sehr gut für einfache PDF-Vergleiche. Wenn Sie eine neuere Version von pdftotext haben, können Sie es
-bbox
stattdessen versuchen-layout
.In Bezug auf unterschiedliche Programme verwende ich gerne diffuse, daher ändert sich der Befehl geringfügig:
http://diffuse.sourceforge.net/
Hoffentlich hilft das.
quelle
Wenn Sie 2-3 große PDF-Dateien (oder Epub-Dateien oder andere Formate, siehe unten) zum Vergleichen haben, können Sie die folgenden Funktionen kombinieren:
Kaliber (um Ihre Quelle in Text umzuwandeln)
meld (um visuell nach den Unterschieden zwischen den Textdateien zu suchen)
parallel (um alle Systemkerne zur Beschleunigung zu verwenden)
Das folgende Skript akzeptiert als Eingabe eines der folgenden Dateiformate: MOBI, LIT, PRC, EPUB, ODT, HTML, CBR, CBZ, RTF, TXT, PDF und LRS.
Wenn nicht installiert, installieren Sie meld, calibre und parallel:
Speichern Sie den folgenden Code in einer Datei mit dem Namen "diffepub" (ohne Erweiterungen) im Verzeichnis "/ usr / local / bin", um den Code von einem beliebigen Ort auf Ihrem Computer ausführen zu können.
Stellen Sie sicher, dass der Eigentümer Ihr Benutzer ist und über Ausführungsberechtigungen verfügt:
Geben Sie zum Testen einfach Folgendes ein:
Ich teste es, um 2 Revisionen eines +1600 Seiten PDF zu vergleichen und es funktioniert perfekt. Da Calibre aus Gründen der Portabilität mit Python geschrieben wurde, dauerte die Konvertierung beider Dateien in Text 10 Minuten. Langsam, aber zuverlässig.
quelle