Ich habe Linux Mint 17.2 x32 Cinnamon. Wahrscheinlich würden diese Schritte auch in Ubuntu 14.04 x32 funktionieren.
- Installieren von Tesseract OCR sudo apt-get install -y tesseract-ocr tesseract-ocr-eng Sie können weitere Sprachen hinzufügen, indem Sie zusätzliche Pakete installieren. Dieser Screenshot stammt von synaptic:
Tesseract-Sprachpaketen in Synaptic
Tesseract verwenden
OPTION 1 - Öffnen Sie über die Befehlszeile das Terminal, gehen Sie in den Ordner, in dem Sie die Bilddateien (jpg, png) aufbewahren, und führen Sie den folgenden Befehl aus:
a) um alle Bilddateien in Text umzuwandeln
for i in *png; do b=`basename "$i" .png`; tesseract -l eng "$i" "$b" text; done
Führen Sie einen Befehl aus, um alle Textdateien zu einer zusammenzuführen cat *.txt >> all.txt
b) um alle Bilddateien in Hocr-Dateien zu konvertieren (mit Firefox öffnen)
for i in *png; do b=`basename "$i" .png`; tesseract -l eng "$i" "$b" hocr; done
OPTION 2 - per GUI
a) Installieren Sie gImageReader und verwenden Sie es
sudo add-apt-repository -y ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install -y gimagereader
b) Der zweite Antrag ist VietOCR. Die aktuelle Version ist 4.0, also laden Sie VietOCR-4.0.zip herunter
Entpacken Sie Dateien und öffnen Sie VietOCR.jar mit Java:
Öffnen Sie VietOCR by Java
Wenn Sie Java nicht installiert haben, können Sie es aus dem Repository installieren oder Sie können offizielles Oracle Java 8 installieren. Schritte zum Installieren von Oracle Java 8 in Ubuntu 14.04
sudo add-apt-repository ppa:webupd8team/java
sudo apt-get update
sudo apt-get install oracle-java8-installer
sudo apt-get install oracle-java8-set-default
Ich empfehle VietOCR, da Sie damit PDF-Dateien OCR-Dateien erstellen können. Eine Massenkonvertierung ist ebenfalls möglich.