Wie entferne ich ein Wasserzeichen aus einer PDF-Datei?

41

Ich dachte, das wäre eine einfache Aufgabe, aber es stellte sich als umgekehrt heraus.

Das Wasserzeichen ist auf jeder einzelnen Seite dasselbe (überlappende, aber transparente) Bild. Ich habe die PDF-Datei mit PDFCreator 0.9.8 selbst erstellt (also keine Copyright-Bedenken).

Ich habe bereits Adobe Acrobat Pro von meinem Freund ausprobiert, aber es hat nicht funktioniert. Es versucht, es zu entfernen, aber es kann nicht. Ich habe versucht, Kopf- / Fußzeile usw. zu entfernen, aber das Wasserzeichen verschwindet einfach nicht.

Wie kann ich das Wasserzeichen entfernen?

Apache
quelle
2
PDF ist ein Ausgabeformat wie eine elektronisch gedruckte Seite. Es ist nicht dazu gedacht, bearbeitet zu werden, und in den meisten Fällen sind Sie nicht in der Lage, das zu tun, was Sie möchten, ohne die Seiten in Bilder zu exportieren und die Wasserzeichen mit Fotos zu versehen.
mk12
Einkaufsempfehlungen sind für alle Stack-Exchange-Websites nicht relevant. Um zu verhindern, dass diese Frage geschlossen wird, würde ich empfehlen, sie in eine Wie-Frage zu ändern, anstatt in eine Wie-Frage
Kanadier Luke REINSTATE MONICA vom
3
Anscheinend würden Sie einfach PDFCreator 0.9.8 verwenden und die Option so einstellen, dass NICHT jeder Seite ein Wasserzeichen hinzugefügt wird. Ich gehe davon aus, dass diese Frage darauf zurückzuführen ist, dass Sie nicht über die Originalquelle verfügen.
Ramhound

Antworten:

73

Für bildbasierte Wasserzeichen gibt es mehrere Tools, die deren automatische Entfernung versprechen. Zum Beispiel:

Sie können alle kostenlos testen, benötigen jedoch eine Lizenz, um die gewünschte Ausgabe zu produzieren.

Das Wasserzeichen dieser spezifischen PDF-Datei (die mir vom OP per E-Mail gesendet wurde) ist jedoch kein einzelnes Bild, das auf allen Seiten wiederholt wird. Wie sich herausstellt, hat PDFCreator es (fast Pixel für Pixel) in jedes einzelne fest codiert. Dies erschwert das Entfernen des Wasserzeichens erheblich (und führt zu einer ziemlich aufgeblähten PDF-Datei).

Da das Wasserzeichen aus vielen kleinen Bildern besteht, können Sie diese mit einem PDF-Editor (z. B. Foxit Advanced PDF Editor ) entfernen , indem Sie sie einfach auswählen und auf drücken Delete. Leider müssen Sie dies für jede Seite wiederholen.

Eine weniger zeitaufwendige Lösung wäre das programmgesteuerte Entfernen des Wasserzeichens. Wir brauchen:

Schritte

  1. Laden Sie Pdftk herunter und extrahieren Sie pdftk.exe und libiconv2.dll in % windir% \ System32 , ein Verzeichnis im Pfad oder an einem anderen Ort Ihrer Wahl.

  2. Laden Sie Notepad ++ herunter und installieren Sie es.

  3. PDF-Streams werden normalerweise mit dem DEFLATE- Algorithmus komprimiert . Dies spart Platz, macht jedoch die PDF-Quelle unleserlich.

    Der Befehl

    pdftk original.pdf output uncompressed.pdf uncompress
    

    Dekomprimiert alle Streams, sodass sie von einem Texteditor geändert werden können.

  4. Öffnen Sie uncompressed.pdf mit Notepad ++, um die Struktur des Wasserzeichens anzuzeigen.

    In diesem speziellen Fall beginnt jede Seite mit dem Block

    q 9 0 0 9 2997 4118.67 cm
    BI
    /CS/RGB
    /W 1
    /H 1
    /BPC 8
    ID Ÿ®¼
    EI Q
    

    und fast 4.000 Blöcke genau wie dieser. Dieser spezielle Block setzt nur eines ( /W 1 /H 1) der Pixel des Wasserzeichens.

    Wenn Sie nach unten scrollen, bis sich das Muster ändert, wird angezeigt, dass der Stream des Wasserzeichens 95.906 Byte lang ist (Zeilenumbrüche werden gezählt). Der exakt gleiche Stream wird auf jeder Seite der PDF-Datei wiederholt.

  5. Drücken Sie Ctrl+ Hund stellen Sie Folgendes ein:

    Find:               q 9 0 0 9 2997 4118\.67 cm.{95881}
    Replace:            (blank)
    Match case:         checked
    Wrap around:        checked
    Regular expression: selected
    . matches newline:  checked
    

    Der reguläre Ausdruck q 9 0 0 9 2997 4118\.67 cm.{95881}entspricht der ersten Zeile des obigen Blocks ( q 9 0 0 9 2997 4118.67 cm) und allen folgenden 95.881 Zeichen, dh dem Stream des Wasserzeichens.

    Durch Klicken auf Alle ersetzen wird es von allen Seiten der PDF-Datei entfernt.

  6. Das Wasserzeichen wurde jetzt entfernt, aber die PDF-Datei enthält Fehler (die Länge der Streams ist falsch) und ist nicht komprimiert.

    Der Befehl

    pdftk uncompressed.pdf output nowatermark.pdf compress
    

    kümmert sich um beides.

  7. uncompressed.pdf wird nicht mehr benötigt. Sie können es löschen.

Das Ergebnis ist dasselbe PDF ohne das Wasserzeichen (und ungefähr halb so groß).

Dennis
quelle
4
Ein weiterer Trick, den ich nützlich fand: Es war schwierig für mich, den Block herauszufinden, der dem Wasserzeichen in meinem PDF entspricht. Also habe ich einfach eine einzelne Seite aus dem PDF extrahiert, im Idealfall eine Seite, auf der nur das Wasserzeichen und nicht viel anderes vorhanden ist. Allein auf dieser einen Seite sollte es einfacher sein, den Block zu ermitteln, der dem Wasserzeichen entspricht. Dann gehen Sie zurück und holen Sie sich das Original-PDF.
Kenny LJ
1
Wow, dies ist der erste Ort im Internet, an dem ich eine gute Möglichkeit gefunden habe, dies zu verwalten. Gibt es Orte, die Sie zum Nachlesen des Containerformats empfehlen?
ConstantineK
2
@hobs IIRC, ich habe Teile der offiziellen PDF-Referenz gelesen , um diese Antwort zu schreiben.
Dennis
1
Danke @Dennis, ich habe dir bereits eine positive Bewertung gegeben, aber dies scheint die beste kanonische Quelle zu sein. Ich konnte das, was ich brauchte, mit ein paar Suchen / Ersetzen-Schritten und ein paar zusätzlichen Komprimierungsversuchen und -fehlern erledigen. RIESIGE HILFE!
ConstantineK
7
Anstelle von können pdftkSie auch verwenden qpdf , um die PDF-Dateien zu dekomprimieren und zu komprimieren. Befehle: qpdf --stream-data=uncompress original.pdf uncompressed.pdfundqpdf --stream-data=compress uncompressed.pdf nowatermark.pdf
David Schuler
6

Es hört sich so an, als ob das Wasserzeichen tatsächlich Teil der Bilder in der PDF-Datei ist und nicht ein separates Bild, das von dem, was Sie zur Anzeige der PDF-Datei verwenden, darüber gerendert wird. Möglicherweise können Sie das Wasserzeichen nicht entfernen, ohne die Bilder aus der PDF-Datei zu extrahieren, sie über einen Bildeditor auszuführen und die PDF-Datei dann manuell zu rekonstruieren.

LawrenceC
quelle
4

Bei Textwasserzeichen kann das Bearbeiten einer PostScript-Version wesentlich einfacher sein: Nach

$ pdftops document.pdf

Bearbeiten Sie die Datei document.ps und konvertieren Sie sie dann über in eine PDF-Datei

$ ps2pdf document.ps

Heiner
quelle
Beachten Sie unter Linux, dass pdftopsund pdf2psanders sind. Verwenden Sie den ersten Befehl, nicht den zweiten.
Camille Goudeseune
1
Wenn Sie wissen, wie der Wasserzeichentext lautet, sehen Sie hier einen Einzeiler. pdftops in.pdf - | sed 's/WATERMARK//' | ps2pdf - out.pdf
Camille Goudeseune
1

Die Artefakte des Stempels bestehen darin, dass Sie ihn in Adobe Acrobat Pro löschen können. Bei einer Mausbewegung wird er jedoch neu generiert, da das Stream-Objekt ihn dauerhaft beibehält.

Wenn Sie versuchen, die PDF-Quelle zu bearbeiten - was schwierig ist, besteht die Möglichkeit, dass die Datei beschädigt wird.

Wenn der Stempel ein Stream ist, können wir ihn unterbrechen, indem wir den Computer vom Netz trennen, was ich auch getan habe.

Dann habe ich mit Adobe Acrobat Pro eine meiner Anmerkungen ausgewählt, mit der rechten Maustaste darauf geklickt, um das Popup-Fenster zu öffnen, und "Kommentarliste anzeigen" ausgewählt.

Wählen Sie das schändliche Wasserzeichen / den Stempel aus der Liste aus, klicken Sie mit der rechten Maustaste, um das Popup-Fenster aufzurufen, und wählen Sie "Löschen". Tun Sie dies auf jeder Seite, auf der die Anbringung erfolgt.

Speichern Sie die Datei unter einem anderen Namen. Meine Anwendung ist abgestürzt, aber nicht vor dem Speichern der Datei!

Öffne die neue & viel kleinere Datei; Beachten Sie, dass alle Wasserzeichen / Stempel Gonzo sind.

In meinem Fall ist die Dateigröße meines 3-seitigen Dokuments von 300 KB auf beeindruckende 60 KB zurückgegangen. Alle Originaldaten und Anmerkungen blieben intakt - ohne Wasserzeichen.

~ Gute Jagd: o)

Alan Hord
quelle
1

Konvertieren Sie das Dokument mit zamzar in eine .rtf-Datei. Das Wasserzeichen verschwindet nach der Konvertierung automatisch. Bitte beachten Sie: - Es funktioniert einwandfrei, wenn das Dokument Textmaterial enthält. Es war schon immer eine große Hilfe. (Mac-Benutzer)

Shifa
quelle
Dies funktioniert nicht für das PDF, das ich ausprobiert habe.
Kenny LJ
1

Einen anderen Weg gefunden:

  1. Verwenden Sie das pdf2htmlEX- Tool (oder einen anderen PDF-zu-HTML-Konverter), um die PDF-Datei in eine HTML-Datei zu konvertieren.
  2. Bearbeiten Sie HTML mit einem Texteditor und entfernen Sie das Wasserzeichen. Speichern Sie es.
  3. Drucken Sie im HTML-Format ein neues PDF-Dokument
  4. Profitieren
Dominik Antal
quelle
Danke. Sind Sie sicher, dass Sie das Wasserzeichen mit Adobe Acrobat nicht auf diese Weise entfernen konnten? (Dies könnte in der Tat eine billigere Lösung sein.)
Apache
Ich glaube, Sie benötigen eine Art Passwort, um das Wasserzeichen in Adobe Reader zu entfernen. Daher habe ich diese Methode verwendet.
Dominik Antal
0

Dies ist eine Ergänzung zu @Dennis 'Antwort vom 18. Juni, 30. Juli 2012. Er spricht mit Sicherheit den schwierigeren Fall an.

Im einfachsten Fall, in dem das Wasserzeichen ein einfacher, schmuckloser Text ist, zum Beispiel

Smedley Für Kommissar

Die unkomprimierten PDF-Wasserzeichen könnten folgendermaßen definiert werden:

    BT
    75.96 625 Td
    (Smedley For Commissioner)Tj
    ET

wo 75.96ist der horizontale Versatz und 625der vertikale Versatz für diese bestimmte Wasserzeicheninstanz. (Ja, es können sowohl reelle Zahlen als auch ganze Zahlen angezeigt werden.)

Ein regulärer Ausdruck wie der folgende funktioniert für alle diese Wasserzeichen und ignoriert alle Variationen in ihrer Platzierung:

^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n

Beachten Sie jedoch, dass eine Vielzahl von modifizierenden PDF-Operatoren mit Wasserzeichen arbeiten kann, die eine kompliziertere Formatierung aufweisen. Solch eine Phantasie kann das, was der Leser erwartet (hofft?), Zu einer zusammenhängenden, leicht zu suchenden Zeichenfolge in ein Durcheinander von Buchstabensuppe verwandeln. Zum Beispiel,

E 1 = mc² von Smedley ™

Könnte das Produkt davon sein:

    BT
    75.96 625 Td
    (E)Tj
    -5 Ts
    (1)Tj
    0 Ts
    ( = mc)Tj
    5 Ts
    (2)Tj
    0 Ts
    (by Smedley)Tj
    5 Ts
    (TM)Tj
    0 Ts
    ET

. . . oder viel schlimmer, wenn Ihr Wasserzeichen farbverbessert ist!

Nachdem ich all dies zur Kenntnis genommen habe, werde ich auch feststellen, dass PDFtk eine GUI-Version hat, die angeblich Wasserzeichen handhabt, unter Berücksichtigung einer Lizenzgebühr von 4 US-Dollar. Überhaupt nicht teuer!

Auf der anderen Seite finde ich, dass die Website derzeit die volle Unterstützung für O / S durch Windows 8und annonciert OS X 10.8 Mountain Lion. Dieser Jahrgang ist über 4 Jahre her. Könnte PDFtk veraltet sein? Ich vermute nicht, aber ich weiß es nicht.

Der Schley
quelle
Vielen Dank für die PDFtk Empfehlung, sieht ordentlich aus, "riecht" aber ja auch etwas oudated. Die kostenlose Version ist 2.02 und Wikipedia sagt, dass sie tatsächlich vor 3 Jahren veröffentlicht wurde: en.wikipedia.org/wiki/PDFtk
Apache
1
@Shiki - Eigentlich habe ich mich ernsthaft mit PDF-Formaten befasst, aber meine detaillierte Bewertung des PDF-Fortschritts in den letzten 10 Jahren aufgegeben. Hier die Zusammenfassung: "Mängel einer 3- jährigen PDFtk- Veröffentlichung im Lichte der PDF-Spezifikationsentwicklung." Obwohl es seit 2005 mehrere Aktualisierungen gegeben hat, werden Sie mit _PDFtk_ aller Wahrscheinlichkeit nach zurechtkommen. _ Ich sage dies, nachdem ich einige allgemein verfügbare, moderne PDF-Dokumentenquellen überprüft habe. Alle PDF-Dokumente, die ich überprüft habe, wurden gemäß den PDF-Standards vor 2010 erstellt ( eigentlich schon lange zuvor). Wenn Sie Zweifel haben, überprüfen Sie die ersten paar Dutzend Bytes der betreffenden PDF-Datei.
Der Schley
0

Hier finden Sie kostenlose und kostenpflichtige Möglichkeiten . Ich empfehle Ihnen, Google Drive zu verwenden.

Google Drive kann Dateien öffnen und kleinere Änderungen vornehmen. Sie können damit auch Wasserzeichen aus PDF online entfernen.

  1. Öffnen Sie Ihr Google Drive-Konto, das im Wesentlichen mit Ihrem Google Mail-Konto identisch ist.
  2. Klicken Sie auf "Neu"> "Datei hochladen", wählen Sie ein PDF-Dokument aus und laden Sie es hoch.
  3. Anschließend können Sie die hochgeladene Datei auf Ihrem Laufwerk überprüfen und mit der rechten Maustaste darauf klicken, um sie mit "Google Text & Tabellen" zu öffnen.
  4. Danach wird Ihr Wasserzeichen automatisch entfernt. Um es zu speichern, gehen Sie zu "Datei" und klicken Sie auf "Herunterladen als" und wählen Sie dann "PDF-Dokument".
Crystal Wang
quelle