Text aus einer PDF-Datei kann nicht kopiert werden

40

Ich benutze den PDF-Reader von foxit, um mein Lehrbuch anzuzeigen. Ich möchte den Text aus der PDF-Datei in ein Word-Dokument kopieren, aber das lässt mich nicht. Ich kann den Text fein auswählen, aber die Option zum Kopieren von Text ist nicht verfügbar. Ich kann Text aus anderen Dokumenten kopieren, aber einige nicht. Gibt es eine Möglichkeit, diesen Schutz in Fenstern zu umgehen?

Jonno_FTW
quelle
Ich sehe, dass meine Antwort bei Ihnen nicht funktioniert. Sie haben also ein Kopfgeld gebucht. Wenn Sie irgendwo ein Beispiel für ein solches PDF posten, werde ich es mir ansehen.
Harrymc
@harrymc: Insbesondere wollte ich die Werte aus Tabelle 6.15 von acousticslab.org/papers/VassilakisP2001Dissertation.pdf
endolith
@ Endolith: Siehe meine neue Antwort.
Harrymc

Antworten:

29

Die PDF-Datei wurde wahrscheinlich gegen Kopieren von Text gesperrt. Es gibt zwei Möglichkeiten, es freizuschalten:

  1. Wenn die PDF-Datei nicht für den Druck gesperrt wurde, können Sie sie auf einem virtuellen PDF-Drucker drucken, um eine entsperrte Datei zu erstellen. Siehe hierzu:
    "Kennwort entfernen und geschützte PDF-Dateien entsperren, die ohne Kenntnis des Geheimnisses gedruckt werden dürfen" .
  2. Wenn die Druckfunktion gesperrt wurde,
    lesen Sie Folgendes : "Einschränkungen entfernen und kennwortgeschützte PDF-Dateien mit PDF Unlocker entschlüsseln" .
Harrymc
quelle
Sie können sehen, ob das PDF zum Kopieren gesperrt ist. Wählen Sie im Menü Datei die Option Eigenschaften. Auf der Registerkarte Sicherheit wird angegeben, ob das Kopieren von Inhalten zulässig ist.
Rob Sedgwick
Versucht das PDF zu drucken. In der gedruckten Datei kann kein Text ausgewählt werden, da der Text in ein Bild konvertiert wurde.
Queezz
@queezz: Das PDF muss zunächst die Bilder enthalten haben.
Harrymc
@harrymc Ja, es gibt Bilder. Text wird aber auch in Bilder umgewandelt. Die Google Chrome-Option funktioniert gut für dasselbe Dokument.
Queezz
Ihr erster Link verweist auf primopdf.com/installers/4.0.1/FreewarePrimo64Setup.exe, was schlimm ist, dass es nicht funktioniert und Sie es anscheinend auch nie auf archive.org archiviert haben. Ihr zweiter Link ist in Ordnung, aber er verlinkt auf eine Dateifreigabeseite. Dfiles.eu/files/7kiqyvswk Die Datei ist in Ordnung, aber mit virustotal überprüft. Aber nicht so leicht zu finden, da es auf dieser mydigitallife-Seite verschiedene Links gibt. Dort heißt es: "PDF Unlocker ist ein kostenloses und dennoch benutzerfreundliches Tool, das über den Link hier heruntergeladen werden kann (aktuelle Version 1.0.4)."
Barlop
25
  1. Öffnen Sie die PDF-Datei in Google Chrome (ziehen Sie die PDF-Datei auf Chrome und legen Sie sie dort ab).
  2. Drucken Sie die jeweilige Seite als PDF oder öffnen Sie einfach die Druckvorschau.
  3. Jetzt können Sie den Text aus der Druckvorschau kopieren oder als PDF ausgeben. Aber ich glaube nicht, dass Sie die Tabelle direkt kopieren können.
Khaleel
quelle
4
Das funktioniert auch bei mir. Dies ist die einfachste Methode, die ich hier sehe.
Endolith
3
Absolut brilliant. Sie können Dateien übrigens in die Tab-Leiste von Chrome ziehen, um sie schnell zu öffnen.
Iono
Keine dieser beiden Methoden hat in Chrome 53 funktioniert. Wurde die Lücke möglicherweise geschlossen?
Simon East
11

Ich konnte mit Ghostscript (verfügbar für Windows) eine DRM-freie Version Ihrer PDF-Datei erstellen .

gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=stripped.pdf VassilakisP2001Dissertation.pdf

Die resultierende Datei stripped.pdfkann in Adobe Reader geladen werden und in Reader können Sie gerne einen beliebigen Teil davon kopieren. Die meisten Formatierungen der Tabelle bleiben erhalten.

Michael Hampton
quelle
Das ist brilliant. Mein Steuerberater verweigert mir DRM-fremde PDF-Dateien und das Kennwort zum Entfernen von DRM. Das löst mein Problem. Ausgezeichnete Arbeit!
Kevinarpe
Wenn die PDF ein Passwort hat, stellen Sie sicher, dass der -sPDFPasswordSchalter ( -sPDFPassword=password) enthalten ist.
Palswim
2

Ich konnte die Tabelle mit Okular (für Linux; Teil von KDE) erfolgreich aus Ihrer PDF-Datei kopieren. Dazu musste ich in die Einstellungen von Okular gehen und "DRM-Beschränkungen einhalten" deaktivieren.

Ich bin mir bewusst, dass Ihnen dies nicht viel hilft, da Sie Windows ausführen, aber es ist möglich, wenn Sie einen Linux-Computer zur Hand haben oder bereit sind, ihn zu installieren.

Leider handelte es sich um einfachen Text ohne Formatierung, aber es sollte nicht allzu schwierig sein, die Tabelle neu zu erstellen. Die Ergebnisse meines Copy & Paste-Abenteuers können Sie hier sehen .

Michael Hampton
quelle
Dafür ist VirtualBox da. : DI kann den einfachen Text auch ohne Formatierung kopieren, aber durch Auswahl einer Spalte ist der Export ziemlich einfach.
Endolith
Sieht so aus, als wäre dies am besten für Tabellen mit Zahlen geeignet, da Sie mit Okular eine rechteckige Auswahl von Text treffen und eine einzelne Spalte in der angegebenen Reihenfolge extrahieren können.
Endolith
Für einzelne Spalten wahrscheinlich. Für die ganze Tabelle siehe meine andere Antwort .
Michael Hampton
Beachten Sie, dass Okular kann auf Windows laufen. Tatsächlich können viele KDE-Programme unter Windows ausgeführt werden .
Bakuriu
1

Sie können GT Text ist ein Programm, das Bilder (auch PDF-Schnappschüsse = Bild) in Text übersetzt. Sie können den Bereich auswählen und in die Zwischenablage kopieren. Es ist kostenlos

Die offizielle Homepage lautet http://gttext.googlecode.com

David
quelle
1

Wenn die Kopie abgeblendet ist, wie es für Sie jetzt zweifelhaft ist, dann ist die PDF-Datei 'gesperrt', sie kann gelesen werden, hindert Sie jedoch in der Tat daran, etwas davon zu kopieren / einzufügen.

Diese Website schaltet ein PDF frei

https://smallpdf.com/unlock-pdf

barlop
quelle
0

Wenn Sie nur nach kurzen Ausschnitten suchen, können Sie häufig ein paar Wörter in Anführungszeichen von Google eingeben und das genaue Zitat finden, das bereits in einem anderen Format gescannt oder von einer anderen Person eingegeben wurde.

Eine weitere Option ist "Dokument aus Foto" in der Android-App von Google Text & Tabellen, mit der der Text über die Texterkennung übertragen wird. Das ist natürlich fehleranfällig.

Ich wünschte, die PDF-Sperrfunktion gäbe es nie. :(

Endolith
quelle
0

Antwort auf Endolith:

Ihr PDF ist gegen Kopieren geschützt, aber nicht gegen Drucken.

Daher habe ich die eine Seite mit Tabelle 6.15 in eine andere PDF-Datei gedruckt, die nicht kopiergeschützt ist, die Tabelle ausgewählt und kopiert und dann in Word eingefügt. Zu meiner großen Überraschung war das Ergebnis der Paste völliger Müll.

Ich habe mir diese Tabelle nun genauer angesehen und ein sehr überraschendes Ergebnis festgestellt: Dies ist keine Tabelle!

Tatsächlich handelt es sich um eine Montage kleiner Textstücke, die so auf der Seite positioniert sind, dass sie wie eine Tabelle aussehen. Dies ist jedoch kein richtiger Tisch.

Das Beste, was Sie tun können, ist, entweder das Ganze als Tabelle umzuschreiben oder einfach in Ihrer Arbeit einen Screenshot dieses tabellenartig zusammengestellten Textes zu verwenden.

Hier ist mein Screenshot der Tabelle aus meinem generierten einseitigen PDF-Dokument :

Bild

Harrymc
quelle
Ich habe versucht, es mit 2 Programmen zu drucken, aber alles, was ich bekam, war eine leere Seite.
Endolith
Mit Foxit Reader habe ich mich auf der Seite positioniert und dann die aktuelle Seite auf einem PDF-Drucker ausgedruckt (ich habe Cute Pdf Writer verwendet ). Ich werde versuchen, das Problem mit dem Kopieren der Tabelle heute Abend zu analysieren,
Harrymc
Ich habe versucht, PrimoPDF und qvPDF (die GhostScript verwendet)
Endolith
Siehe meinen obigen Zusatz.
Harrymc
... habe ich auch mein einseitiges PDF hier hochgeladen (60 Sekunden Wartezeit).
Harrymc
0

Eine andere Möglichkeit ist Evince .

In Windows scheint es das Kopieren standardmäßig zu unterstützen.

Unter Linux können Sie das Kopieren aktivieren, indem Sie die override_restrictionsEinstellung überprüfen , falls dies noch nicht geschehen ist. Befolgen Sie dazu diese Anweisungen ( dconf-editor/org/gnome/evinceoverride_restrictions).

Endolith
quelle
0

Dies schaffte es, einfachen Text zu konvertieren. Es hatte allerdings mit Tischen zu kämpfen.

http://www.onlineocr.net/documents

Rob Sedgwick
quelle