PDF to Text Konverter [geschlossen]

9

Ich suche nach einer "Ein-Klick" -Methode, mit der ich JEDES PDF in einfachen Text konvertieren kann. Ideal unter OSX oder Linux.

Im Idealfall würde die Lösung OCR-Funktionalität enthalten, dies muss jedoch nicht unbedingt der Fall sein.

Die oberste Priorität ist etwas, das JEDE Datei OHNE Konfiguration aufnehmen kann.

der Spiegel
quelle

Antworten:

23

Es gibt xpdf, das die pdftotextBinärdatei enthält.

Pdftotext konvertiert PDF-Dateien (Portable Document Format) in einfachen Text.

Unter Linux ist ein Installationsprogramm verfügbar. Es scheint, dass es auch im poppler-utilsPaket kommt. Unter OS X können Sie es mit Homebrew installieren (zuerst installieren) und dann verwenden

brew install homebrew/x11/xpdf

Dadurch werden die Quelldateien heruntergeladen und für OS X kompiliert. Danach verwenden Sie sie einfach wie folgt:

pdftotext your_pdf_file.pdf

Dadurch wird eine Nur-Text-Datei generiert. Es gibt auch einige Optionen. man pdftotextWeitere Informationen finden Sie hier.

Eine Alternative ist Poppler in OSX:

brew install poppler

in Debian und Freunden

apt-get install poppler-utils
slhck
quelle
Ab heute ist der Befehlbrew install homebrew/x11/xpdf
Diego Vieira
1
@DiegoVieira Danke. Das nächste Mal können Sie gerne eine Bearbeitung vorschlagen!
Slhck
Ein Vorteil bei der Verwendung von Poppler anstelle von xpdf / pdftotext?
Gonzalo Bahamondez
brew install Caskroom/cask/pdftotext
Hugo