Gibt es eine bessere Möglichkeit, ein PDF zu redigieren?

24

Ich musste kürzlich ein paar PDFs drucken, um sie an jemanden zu senden, aber ich wollte ein paar kleine Textteile redigieren (verdunkeln).

Bei einer schnellen Google-Suche wurden keine Tools für diesen speziellen Zweck gefunden, daher bin ich auf imagemagick & gimp zurückgefallen:

  • convert document.pdf document.png
  • gimp document-0.png
  • (Verwenden Sie den Pinsel, um den Text zu verdunkeln.)
  • Drucke die redigierte Seite von Gimp
  • drucke die restlichen seiten aus xpdf

Das Problem bei dieser Strategie ist, dass der Konvertierungsprozess (von PDF zu PNG oder einem anderen Format) an Qualität verliert. Ich habe versucht, das PDF in Gimp zu bearbeiten, aber es hat nicht sofort funktioniert.

Gibt es ein spezielles Tool, das eine solche Bearbeitung ermöglicht? (Es muss nicht einmal "echte" Redaktion sein - ich sende keine Softcopy, so dass "falsche" Redaktion funktioniert, da die Hardcopy nicht gehackt werden kann, um den zugrunde liegenden Text zu enthüllen.)

Oder gibt es einen Trick, um PDFs in Gimp bearbeiten zu können?

bstpierre
quelle
1
PDF ist skalierbar, PNG ist eine Rastergrafik, weshalb es wahrscheinlich zu Qualitätsverlusten bei der Konvertierung kommt. Konvertieren Sie stattdessen in ein skalierbares Format wie SVG.
Anonym
@Anonymous: Schöne Idee, aber nicht brauchbar. Die resultierende SVG-Datei ist riesig. Ich musste den Betrachter nach 30 Minuten und einem GiB oder so des Speicherverbrauchs TÖTEN.
bstpierre

Antworten:

15

(ursprünglich habe ich Okular wieder aufgenommen, aber es hat nicht wie erwartet funktioniert)

1. Bearbeiten Sie das Dokument in einem Vektoreditor

Ich konnte eine PDF-Datei in Inkscape öffnen , ein Rechteck über ein Textstück ziehen und es ausdrucken. Inkscape ist ein Vektoreditor, sodass keine Rasterung erforderlich ist. Einige Schriften sahen jedoch falsch aus - wahrscheinlich, weil das Dokument auf einem Windows-Computer mit Schriften erstellt wurde, die auf meinem nicht vorhanden sind.

Beachten Sie, dass jede Methode, die keine Rasterung beinhaltet, nur akzeptabel ist, wenn Sie das redigierte Dokument auf Papier drucken und nicht elektronisch verteilen möchten, da der Text immer noch unter Blackouts abgerufen werden kann.

2. Erhöhen Sie die Rasterauflösung beim Öffnen in einem Bitmap-Editor

Zum Thema "Qualitätsverlust" beim Öffnen der Seite in Gimp : Sie können eine PDF-Datei direkt in Gimp öffnen. Es wird dabei gerastert. Das Ausmaß des Qualitätsverlusts hängt von der Auflösung ab, die Sie beim Importieren auswählen. 300 dpi sollten eine sehr anständige Qualität liefern (der Standardwert ist 100).

Sie können mit dem ImageMagick- convertBefehl auch gute Ergebnisse erzielen, wenn Sie ihn anweisen, die Auflösung zu erhöhen:

convert -density 300x300 ...
Sergey
quelle
1
+1 und akzeptiert! Vielen Dank, dass Sie inkscape vorgeschlagen haben, es hat einen vernünftigen Job gemacht (nicht perfekt - es hat ein paar (für mich unwichtige) Grafikobjekte verloren) - aber sehr vernünftig). Und der Tipp convertwar auch gut: Die Beschwörung, die ich verwendet habe, war convert -density 300x300und es gibt keinen Qualitätsverlust.
bstpierre
+1 für die Erwähnung von GIMP kann pdfs recht gut verarbeiten
don.joey
8
Warnung an die allgemeine Bevölkerung: Die hier vorgeschlagenen Redaktionsmethoden, bei denen der hier vorgeschlagene Text beibehalten wird (z. B. alle, die eine Rasterisierung vermeiden), sind nicht sicher. Text kann weiterhin unter Blackouts ausgewählt oder aus der Quelle der Datei gelesen werden. Siehe zum Beispiel freerepublic.com/focus/f-news/2706743/posts und hackaday.com/2008/08/01/exposing-poorly-redacted-pdfs
naught101
Obwohl in der ursprünglichen Frage nur das Versenden von Ausdrucken gefragt wurde, für die nicht-rasterisierende Methoden zulässig sind, warnt das Downvoting nicht klar genug vor dem Sicherheitsrisiko, wenn das Ergebnis elektronisch verteilt wird.
Jesse Glick
4
@JesseGlick: Anstatt mich dafür zu "bestrafen", dass ich einen Anwendungsfall nicht angesprochen habe, der nicht einmal in der ursprünglichen Frage erwähnt wurde, hätten Sie die Antwort auch bearbeiten können. Das wäre für die zukünftigen Besucher vorteilhafter.
Sergey
10

Grundsätzlich versuchen Sie, eine PDF-Datei hervorzuheben / mit Anmerkungen zu versehen, aber mit einer gewissen Flexibilität in Bezug auf Markierungsopazität und -farbe (Sie haben erwähnt, dass Sie nichts zensieren / entfernen müssen, sondern lediglich redigieren). Haben Sie sich hier die Antworten angesehen: Wie kann ich PDFs hervorheben oder mit Anmerkungen versehen?

Eine der am höchsten bewerteten Antworten empfiehlt Xournal , das hier nicht erwähnt wurde und meine bevorzugte Waffe wäre. Es ist ein Tool, mit dem Sie handschriftliche Notizen erstellen können, das jedoch über zusätzliche Funktionen verfügt, mit denen Sie PDF-Dateien mit Anmerkungen versehen können. Standardmäßig werden Ihre Anmerkungen als separate Datei gespeichert, aber Sie können die mit Anmerkungen versehene PDF-Datei auch als neue PDF-Datei exportieren. Dies sollte das Layout, die Schriftarten usw. beibehalten.

Mit Xournal wählen Sie "Annotate PDF" (PDF mit Anmerkungen versehen), dann maskieren Sie die Teile, die Sie bearbeiten möchten, mit einer durchgehenden schwarzen Markierung und "Export to PDF" (Als PDF exportieren).

Es gibt einige Geschichten im Internet, die darauf hindeuten, dass Xournal den Text in der exportierten PDF-Datei rastert (danke für diesen Hinweis, MHC). Dies scheint nicht zuzutreffen: Bei einfachen Anmerkungen bleibt der Text auswählbar und durchsuchbar, und die Dateigröße nimmt nicht wesentlich zu (im folgenden Beispiel von 205 KB auf 220 KB).

Führen Sie zum Installieren ein Terminal aus: sudo apt-get install xournaloder wählen Sie es einfach im Software Center aus

Xournal-Schnittstelle Resultierendes exportiertes PDF

Tomas
quelle
Xournal ist gut, aber Sie müssen wissen, dass es nur Raster-PDFs exportieren kann, was bedeutet, dass alle Text- und Vektorinformationen dabei verloren gehen. Wenn Sie damit umgehen können, ist Xournal die Anwendung Ihrer Wahl.
Glutanimate
1
Danke für das Feedback, @MHC. Xournal ist nicht rastern, siehe überarbeitete Antwort für weitere Informationen.
Tomas
3
Ich habe es einfach selbst ausprobiert und du hast absolut recht. Entschuldigung für die Verwirrung. Es war eine Weile her, dass ich Xournal verwendet hatte und irgendwie hatte ich den Eindruck, dass die exportierten Dokumente keine echten PDFs waren. Danke, dass du das klargestellt hast!
Glutanimate
1
Das funktioniert gut, aber ich konnte keinen sauberen Weg finden, um Informationen zu redigieren. Ich musste das Zeichenwerkzeug verwenden, um zu kritzeln, was sehr chaotisch aussieht und mir die Professionalität fehlt, die ich gerne hätte. Andernfalls können Sie den Inhalt beim Exportieren rastern, sodass er nicht ausgewählt und erkannt werden kann.
Flickerfly
Kombinieren Sie diese Antwort mit @ balus, die den convertBefehl ImageMajick verwendet, um eine echte Bearbeitung zu erzielen, bei der Textdaten durch Bilder ersetzt werden .
Colan
6

Sie können Okular verwenden.

sudo apt-get install okular
  1. Öffnen Sie das PDF mit Okular.
  2. Drücken Sie F6.
  3. Drücken Sie 8.
  4. Markieren Sie den Text, den Sie bearbeiten möchten.
  5. Klicken Sie mit der rechten Maustaste auf den Text, wählen Sie Eigenschaften aus, wählen Sie "Typ" als "Hervorheben" aus und drücken Sie Ok.
  6. Drucken Sie die Datei als PDF aus.
eharvey
quelle
4
Erwähnen Sie vielleicht, wie Sie die Hervorhebung schwarz machen.
Equaeghe
1
Okular kann mit jeder Farbe (Schwarz) dieser Funktionen redigieren: Texthervorhebung, Freihandlinie und Polygonverknüpfungen mit innerer Füllung. Sie können die Einstellung als eigenes benutzerdefiniertes Anmerkungswerkzeug speichern. Einfach immer und immer wieder verwenden. Wenn Sie dann die Datei als PDF drucken, sollten Sie die "Rasterung" erzwingen, um sicherzustellen, dass die Korrektur nicht rückgängig gemacht werden kann. Okular Version 1.1.3
shadowbq
Es ist standardmäßig schwarz und funktioniert mit der neuesten Okular-Version. Vielen Dank!
TheFrack
5

Ich redigiere jeden Tag eine Menge PDF-Dateien, daher verbringe ich viel Zeit damit, darüber nachzudenken, wie ich es am besten mache.

Für mich ist der beste Weg, PDF in eine einseitige PDF-Datei aufzuteilen, um sie mit GIMP zu bearbeiten und zu kombinieren. Ich verwende imagemagick nicht für alle Dateien (ich verwende es überhaupt nicht), daher verliere ich keine Textebene auf allen Seiten, sondern nur auf redigierten. Laden Sie nicht die gesamte PDF-Datei auf einmal, da dies zu Speichermangel führt.

PDF in 1-seitige Dateien aufteilen

Mit dieser Bash-Funktion können Sie PDF-Dateien auf einfache Weise in 1-seitige PDF-Dateien aufteilen (in ~ / .bashrc):

function pdf_split(){
    for file in "$@"; do
        if [ "${file##*.}" != "pdf" ]; then
            echo "Skip $file because it's not PDF file";
            continue
        fi; 
        pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}') 
        echo "Detect $pages in $file";
        filename="${file%.*}";
        unset Outfile;
        for i in $(seq 1 "$pages"); do
            pdftk "$file" cat "$i" output "$filename-$i.pdf";
            Outfile[$i]="$filename-$i.pdf";
        done;
    done;
};

Sie können jetzt eingeben split_pdf file.pdf, um viele PDF-Dateien abzurufen.

Dateien redigieren

Aber jetzt müssen Sie alle diese Dateien bearbeiten. Sie können es mit tun gimp original-filename-*.pdf. Ich schlage vor, die Verknüpfung in GIMP (Hauptfenster-> Bearbeiten-> Verknüpfung) zu konfigurieren, um die Datei zu ersetzen (ich verwende STRG + R), den Filter zu verwischen (z. B. STRG + D), die Datei zu schließen (z. B. STRG + W) und GIMP zu beenden ( zB CTRL + Q). Denken Sie daran, in GIMP nicht zu viele Dateien gleichzeitig zu laden, sondern GIMP, wie Sie es etwa nach dem Öffnen laden, damit Sie gimp original-filename-*.pdfauf tausend Dateien sicher zugreifen können.

Dateien kombinieren

Sie können Dateien einfach kombinieren mit: pdftk originam-filename-*.pdf cat output "new-file-anon.pdf";

Verbinden Sie alles miteinander

Diese Operationen wiederholen sich sehr oft und sind langweilig. Deshalb verbinde ich alles in einem Skript:

function pdf_redact(){
    for file in "$@"; do
        if [ "${file##*.}" != "pdf" ]; then
            echo "Skip $file because it's not PDF file";
            continue
        fi; 
        pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}') 
        echo "Detect $pages in $file";
        filename="${file%.*}";
        unset Outfile;
        for i in $(seq 1 "$pages"); do
            pdftk "$file" cat "$i" output "$filename-$i.pdf";
            Outfile[$i]="$filename-$i.pdf";
        done;
        gimp "${Outfile[@]}";
        pdftk "${Outfile[@]}" cat output "$filename-anon.pdf";
        rm "${Outfile[@]}";

    read -p "Do you want open output file? " -n 1 -r
    echo    
    if [[ $REPLY =~ ^[Yy]$ ]]
    then
            evince "$filename-anon.pdf";
    fi

    read -p "Do you want upload output file to Scribd.com? " -n 1 -r
    echo 
    if [[ $REPLY =~ ^[Yy]$ ]]
    then
        scribd_up "$filename-anon.pdf";
    fi
    done;
};

Die neueste Version dieses Skripts ist immer verfügbar unter: http://dostep.jawne.info.pl/it/bashrc

Denken Sie daran, GIMP (STRG + Q) nach der gesamten Bearbeitung zu schließen, um das Skript fortzusetzen.

In der Sucht ist es mir wichtig , redigierte Dateien zu öffnen (ich lese gerne, um zu überprüfen, ob alle vorhanden sind) und sie mit meinem anderen Skript - scribd_up - auf Scribd hochzuladen , damit ich jetzt sehr effizient viele PDF-Dateien redigieren kann.

Adam Dobrawy
quelle
2

Öffnen Sie das PDF mit dem kostenlosen Tool PDF-Xchange PDF Viewer . Verdunkeln Sie den zu redigierenden Text mit schwarzen Rechtecken. Drucken. So erhalten Sie eine einfache, hochwertige "gefälschte" Redaktion.

MetaEd
quelle
Das scheint ein Win32-Tool zu sein. Lassen Sie mich wissen, wenn ich den Link für den Linux-Port verpasst habe ...
bstpierre
3
Der kostenlose tragbare PDF-Xchange-Viewer funktioniert mit Wein.
Sabacon
Danke, das hat bei mir mit Wein perfekt geklappt. Die inkscape- und gimp-Lösungen sind nur für Einzelseitenreduktionen wirklich nützlich.
Gearoid Murphy
2

Verwenden Sie LibreOffice Draw für die schnelle Bearbeitung, die Sie suchen. Nachdem Sie fertig sind, können Sie es als LibreOffice Draw-Format speichern oder erneut in das PDF-Format exportieren ( File> Export as PDF).

Bildbeschreibung hier eingeben

Um PDF-Dateien in LibreOffice Draw importieren zu können, müssen Sie zuerst das Paket installieren libreoffice-pdfimport.

Installieren Sie es über das Ubuntu Software Center ( libreoffice-pdfimport Installieren Sie libreoffice-pdfimport ) oder über ein Terminal mit sudo apt-get install libreoffice-pdfimport.

Bruno Pereira
quelle
2

Sie können auch dieses Tool ausprobieren: https://launchpad.net/updf

Hier ist es (aber trotzdem ist der Text wählbar):

Bildbeschreibung hier eingeben

franzlorenzon
quelle
1
uPDF ist großartig, da es das Original-PDF und seinen Text- und SVG-Inhalt beibehält. Es scheint jedoch einige Probleme mit der Komprimierungsstufe zu geben. Bearbeitete PDFs sind ca. 3-4x größer als das Original. Vielen Dank, dass Sie dies gepostet haben. UPDF war mir nicht bekannt.
Glutanimate
Ja, ich weiß, es hat einige Probleme, es ist ein bisschen rau. Hoffentlich korrigieren neuere Releases diese Probleme ... :)
franzlorenzon
Wie bereits erwähnt, hat uPDF eine Menge Bugs (und nicht einmal Undo / Redo), aber in meinem Fall ist alles noch gut gelaufen, also danke!
Balu
2

Ich erinnere mich, dass ich und ein Kollege einmal einen Weg finden mussten, um ein paar PDFs zu bearbeiten. Am Ende verwendeten wir Gimp. Ich werde Ihnen die Details kommentieren ... wir öffnen das PDF direkt mit gimp (in einem Terminal)

gimp the_file.pdf

Sobald Sie mit der Bearbeitung fertig sind, haben wir die Änderungen nicht gespeichert, stattdessen drucken wir sie als PDF-Datei aus ... Das schien in Ordnung zu sein.

maniat1k
quelle
Aus irgendeinem Grund weigert sich gimp, Änderungen an der Datei vorzunehmen. Ich musste zuerst mit imagemagick konvertieren convertund dann die konvertierte Datei bearbeiten. (Siehe akzeptierte Antwort.)
bstpierre
ok, die lösung von inkscape ist gültig. Aber ich wiederhole es dir. The Gimp kann PDF-Dateien direkt bearbeiten. = D
maniat1k
Gimp scheint mit den meisten PDF-Dateien zu funktionieren, aber die Datei, die ich letzte Nacht verwendet habe, hat nicht richtig funktioniert. Inkscape hat diese Datei ordnungsgemäß verarbeitet.
bstpierre
2

PDF Studio ist keine OpenSource-Software und muss gekauft werden.

In Bezug auf diese Frage gibt es ab Version 8 eine manuelle Korrekturfunktion. Benutzer können ein Textobjekt auswählen und bearbeiten. Der Inhalt wird aus der PDF-Datei entfernt und durch ein schwarzes Rechteck ersetzt.

In Version 9, die im dritten Quartal 2013 verfügbar sein wird, stehen auch Redaktionsanmerkungen und Brennen für Bilder und Formen zur Verfügung.

Lilou
quelle
4
Laut FAQ sollten Sie Ihre Zugehörigkeit zu dem Produkt, für das Sie werben , offenlegen.
bstpierre
Auch wenn dies wahrscheinlich eher eine Werbeanzeige als eine Antwort ist, muss ich sagen, dass PDFstudio wirklich ein großartiges Stück Software ist. Es mag ein bisschen überteuert sein, aber es ist mit Sicherheit die beste PDF-Bearbeitungssuite für Linux. Stellen Sie sicher, dass Sie zumindest die Testversion ausprobieren .
Glutanimate
2

Da viele Lösungen hier das Redigieren / Verdunkeln durch Anmerkungen (die den ursprünglichen Inhalt im PDF belassen) empfehlen, empfehle ich, das PDF anschließend zu rastern, um den ursprünglichen Inhalt wirklich zu entfernen. (Sei nicht dieser Typ .)

Hier ist eine Möglichkeit, um das zu tun, was gleichzeitig die Qualität und die Dateigröße niedrig hält (zumindest bei einem Haufen schwarzer / weißer Seiten):

$  convert -quality 100 -density 180 -compress zip notreallyredacted.pdf trulyredacted.pdf

Hinweis: convertBenötigt ImageMagick.

Hinweis 2: convertDer Inhalt von Formularen, die Sie möglicherweise ausgefüllt haben, bleibt nicht erhalten. Damit es nicht verloren geht, möchten Sie das Dokument möglicherweise zuerst in einer Art Datei evince(oder in einer beliebigen Anwendung, in der Sie das Formular ausgefüllt haben) drucken und dann rastern.

balu
quelle
Habe gerade den Berechtigungs-Fix hinzugefügt. Diese Antwort sollte mit der Xournal-Antwort kombiniert werden.
Colan
1

Der beste Weg, dies zu tun, ist die Verwendung von http://www.pdfescape.com . Sie können Anmerkungen hinzufügen, Text und Bilder hinzufügen, ein "Whiteout" -Rechteck um das zu redigierende Material ziehen und es schnell herunterladen und speichern. Es funktioniert auch sehr gut mit mehrseitigen Dokumenten, womit viele andere Lösungen nicht gut funktionieren. Wenn Sie beispielsweise ein mehrseitiges Dokument in Gimp oder Inkscape öffnen, können Sie jeweils nur eine Seite öffnen. In PDFescape ist der Vorgang viel schneller. Der gesamte Vorgang zum Redigieren eines zweiseitigen Dokuments dauert weniger als eine Minute.

user184478
quelle
1
Wischt die übermalten Daten nicht wirklich ab. (Ich kann immer noch danach suchen und es wird unten "hervorgehoben").
Frank Nocke
1

Wenn Sie sich nicht an die richtige Beschwörung erinnern möchten, convertkönnen Sie pdf-redact-tools verwenden , ein Shell-Skript, das das Auflösen eines PDF -Dokuments in PNG-Bilder automatisiert und diese nach der Bearbeitung wieder zusammenfügt (mit einem Tool Ihrer Wahl, z. B. gimp) ). Es ist bequem zu installieren .

kynan
quelle
0

Es gibt mehrere Editoren, mit denen Sie PDF-Dokumente direkt bearbeiten pdfeditoder in andere Vektorformate konvertieren können, die möglicherweise besser unterstützt werden, z pstoedit. Allerdings würde ich die Verwendung von keinem von ihnen empfehlen, da das Risiko, etwas Dummes zu tun, wie einfach den Text mit Schwarz zu übermalen, während die Vektoren an Ort und Stelle bleiben, zu einfach ist, wodurch die Redaktion trivial rückgängig gemacht werden kann.

Die Route von Vektor zu Bitmap ist die sicherste Methode, vorzugsweise die 1-Bit-Bitmap-Route, um mögliche Probleme mit Alphakanälen oder Farbunterschieden zu vermeiden, die den Text lesbar machen könnten.

Wenn möglich, sollten Sie das Originaldokument immer redigieren und nur die Informationen entfernen, nicht die Farbe auf dem PDF, da selbst der Kerning und der Abstand des Texts um den redigierten Text es verraten können.

Grumbel
quelle
Ich verstehe die Probleme beim Redigieren richtig, aber ich danke Ihnen, dass Sie sich die Mühe gemacht haben, sie auf jeden hinzuweisen, der danach kommt. In meinem Fall ist das PDF selbst verfügbar - alles, was ich suche, ist eine Hardcopy. (Das PDF wird gelöscht, sobald ich eine Hardcopy habe.) FWIW, pdfedithat nicht funktioniert: Wenn ich ein schwarzes Rechteck über den fraglichen Text gezogen habe, hat es den Rest der Seite mit einem Kernel versehen und mir ein Dokument mit dem Buchstaben a hinterlassen einzelnes schwarzes Rechteck.
bstpierre
0

Ich füge der Liste hinzu: Krita . Hatte keinen Qualitätsverlust, denn beim Importieren von PDF können Sie dpi definieren (setzen Sie es auf 300, wie @Sergey sagte). Nach der Bearbeitung klicken Sie auf "Als PDF exportieren". Schließlich finde ich Krita intuitiver als Gimp, nachdem ich lange Zeit Photoshop verwendet habe.

jmjr
quelle
-1

Wenn Sie mit LibreOffice eine PDF-Datei erstellen, öffnen Sie das Dokument in LibreOffice, markieren Sie den zu korrigierenden Text, klicken Sie mit der rechten Maustaste und wählen Sie ein Zeichen aus, wählen Sie Hintergrund und klicken Sie auf Schwarz. Als PDF exportieren.

Dave
quelle