Mein PDF enthält 600 Seiten mit Textbildern. Es hat 2 Schichten .
Schicht 1: Hintergrundfarbbild
Ebene 2: Textbild
Ich möchte alle Hintergrundbildebenen in der gesamten PDF-Datei entfernen, wie im Bild gezeigt.
Können Sie mir eine Software / ein Tool vorschlagen?
software-recommendation
pdf
image-processing
Raghu G.
quelle
quelle
Antworten:
Überblick
Was Sie suchen, sind Tools wie Scan Tailor und Unpaper , die in der Lage sind, Schwellenwerte zu erreichen , zu entflecken und Rauschen zu entfernen . Beide Tools arbeiten mit Bildern und nicht mit PDF-Dateien. Mit den am Ende dieser Antwort beschriebenen Tools können Sie jedoch problemlos zwischen den verschiedenen von diesen Anwendungen verwendeten Formaten und PDF konvertieren.
ScanTailor
Ein Video-Tutorial finden Sie hier . Eine ausführlichere Dokumentation finden Sie im offiziellen Wiki . Sie werden wahrscheinlich am meisten an der Seite über den Schwarzweiß-Ausgabemodus und die Filtereinstellungen interessiert sein .
Papier entfernen
Ich habe nicht mit gearbeitet
unpaper
mir selbst gearbeitet. Soweit ich weiß, bietet es weitaus mehr Funktionen als ScanTailor, ist aber auch viel schwieriger zu beherrschen.Es gibt keine GUI-Oberfläche und Sie müssen sich auf Befehlszeilenoptionen verlassen, um Ihre Arbeit zu erledigen. Auf der anderen Seite bedeutet dies, dass Konvertierungen mit
unpaper
einfach mithilfe von Skripten automatisiert werden können.Sie können einige Skriptbeispiele in Bezug auf die Umwandlung eines Scan in Schwarz-Weiß und Entfernen der Hintergrund finden hier .
Einige hilfreiche Tools für die Arbeit mit Unpaper und ScanTailer
Ich habe nicht genug Zeit, um ein vollständiges Tutorial zu ScanTailor und unpaper¹ zu schreiben, aber hier sind einige Hinweise zum Konvertieren zwischen
.pdf
und den von diesen Tools unterstützten Bildformaten:Sie können
pdfimages
PDF-Dokumente in Einzelseitendateien.ppm
konvertieren, die von gelesen werden könnenunpaper
.Anwendungsbeispiel:
ScanTailor nimmt keine
.ppm
Dateien als Eingabe. Sie müssen sie zuerst in ein anderes Format wie das verlustfreie konvertieren.png
.mogrify
aus derimagemagick
Tool-Suite kann dies für Sie tun.Anwendungsbeispiel:
Das Ausgabeformat von ScanTailor und Unpaper sind Einzelseitendateien
.tiff
. Um sie wieder zu konvertieren,.pdf
würde ich vorschlagen,tiffcp
und zu verwendentiff2pdf
.Anwendungsbeispiel:
Installation
Dieser Befehl installiert alle oben genannten Tools:
¹: Wenn Sie dies lesen, können Sie gerne eine ausführlichere Antwort basierend auf ScanTailor und / oder Unpaper erstellen.
quelle
Ich habe gerade eine sehr einfache Lösung gefunden:
installieren
gscan2pdf
.Öffnen Sie
gscan2pdf
das PDF und importieren Sie es.Werkzeuge-> Schwelle. Der Standardwert von 80% hat bei mir gut funktioniert.
Speichern Sie das PDF an einem anderen Ort.
quelle
Vielleicht kann Ihnen der Master-PDF-Editor helfen, obwohl ich ohnehin nicht gefunden habe, dies automatisch über die 600 Seiten zu tun.
quelle