Hat jemand eine Empfehlung oder ein Verfahren zum Reparieren einer beschädigten PDF? Wenn ich die Datei öffne, erhalte ich die Meldung "Beim Öffnen dieses Dokuments ist ein Fehler aufgetreten. Die Datei ist beschädigt und kann nicht repariert werden." Es scheint eine Vielzahl von Tools zu geben, aber keines, das ich als seriös bezeichnen könnte. Gibt es dafür möglicherweise OpenSource-Linux-basierte Lösungen?
pdf
repair
ghostscript
Tim Alexander
quelle
quelle
Antworten:
Ghostscript repariert Ihre beschädigte PDF-Datei automatisch ... wenn es sie überhaupt öffnen kann (dh wenn sie nicht irreparabel beschädigt ist). Aber danach müssen Sie das Ergebnis noch einmal überprüfen ...
Versuchen Sie unter Linux den folgenden Befehl:
Versuchen Sie unter Windows Folgendes:
quelle
Ich hatte eine beschädigte PDF-Datei,
print.pdf
die Ghostscript nicht öffnen konnte, aber die üblichen grafischen Linux-PDF-Viewer (Okular, Evince) ließen sich problemlos öffnen. (In meinem Fall hatte die Datei beim Öffnen in einem Hex-Editor am Anfang anstelle eines PDF-Headers einen Müll.)Diese PDF-Viewer verwenden Poppler als Back-End-PDF-Renderer. So können Sie die PDF-Datei mithilfe der Poppler-Befehlszeilentools reparieren. In Ubuntu sind diese im
poppler-utils
Paket enthalten. Ich benutzte:Das hat eine PDF-Datei mit korrekten Headern erzeugt, die jetzt von Tools wie Ghostscript akzeptiert werden.
quelle
mutool
( Projektseite , Manpage ) repariert defekte PDFs, ohne sie auszudrucken .sudo apt-get install mupdf-tools
mutool clean input.pdf output.pdf
Alternativ gibt es einige Tools und Frameworks, mit denen PDF-Dateien in ihre Komponenten zerlegt / dekompiliert werden können, ohne sie zu rendern. Diese können zum Extrahieren von Text, Skripten und Bildern nützlich sein. In dieser Antwort finden Sie eine Liste solcher Tools: https://reverseengineering.stackexchange.com/q/1526/8210 . Du kannst zB die aktuelle Top-Antwort Origami ausprobieren , sie hat einen GTK-basierten Viewer.
quelle
mutool clean
nicht alle möglichen Fehler. Ich habe eine Datei, die verschiedene Fehler in der Schriftart und den Inhaltsströmen enthält, und mutool behält diese Fehler bei.Ich hatte eine beschädigte PDF-Datei, weil die zum Herunterladen verwendete PHP-Datei am Ende einige Fehler (in HTML) und NUL-Zeichen aufwies.
Die Lösung bestand darin, das PDF mit Notepad ++ zu öffnen und den gesamten Text nach der Zeile zu entfernen
quelle
%%EOF
. Ich habe alles nach dem ersten Mal%%EOF
mit einem Hex-Editor gelöscht . Jetzt funktioniert alles gut.