Installieren Sie tesseract ocr 3 unter OSX

0

Ich versuche, Tesseract OCR unter OSX 10.6 zu installieren ...

Ich habe es geschafft, Leptonic (durch Herunterladen von src und Installieren mit ./configure; make; sudo make install) scheinbar ohne Probleme zu installieren - aber ich weiß nicht, wie ich es überprüfen soll.

Ich habe auch Tesseract OCR 3 (von Google Code mit ./runautoconf; ./configure; make; sudo make install) scheinbar ohne Probleme installiert - aber ich weiß auch nicht, wie ich das überprüfen soll.

Wenn ich renne tesseract input.jpg .bekomme ich eine Fehlermeldung ...

 bash-3.2$ tesseract ~/Desktop/DCIM/101_FUJI/DSCF1043.JPG . 
 Tesseract Open Source OCR Engine with Leptonica
 Error in pixReadStreamJpeg: function not present
 Error in pixReadStream: jpeg: no pix returned
 Error in pixRead: pix not read 
 Error in fopenReadStream: file not found 
 Error in pixRead: image file not found
 Image file ######
 Exif cannot be read! 

Ähnliche Fehler, wenn ich TIFF-Datei als Eingabe verwende.

Ich glaube, ich brauche einige Bibliotheken - Anweisungen für Ubuntu sagen, um libjpeg12-dev usw. zu installieren ...

Hat jemand Details, wie man Tesseract unter OSX installiert?

Billy Moon
quelle

Antworten:

2

Installieren Sie macports: Download- und Installationsanweisungen finden Sie unter http://www.macports.org/ .

Aktualisieren Sie den Ports-Baum: sudo port selfupdate

Installieren Sie tesseract: sudo port install tesseract

Für den Tesseract-Port scheint es keine Variante zu geben, die JPEG unterstützt. Daher müssten Sie einen Grafikkonverter und ein Bildanpassungspaket (Helligkeit, Kontrast und Schärfe) installieren: sudo port install imagemagick

Konvertieren Sie Ihr JPEG in das TIFF-Format und führen Sie OCR mit tesseract aus: convert input.jpg input.tiff ; tesseract input.tiff ocr-text-ouput -l eng ; rm input.tiff

Der resultierende Text sollte in der Datei ocr-text-ouput.txt enthalten sein.

ps Sie können das Bild ein wenig anpassen, um eine potenziell bessere OCR-Erfahrung mit Konvertierungsoptionen wie diesen zu erzielen: convert -sharpen 1 -brightness-contrast 3X30 input.jpg input.tiff

Tajh
quelle
Ich musste 'tesseract-eng' installieren, um Segmentierungsfehler 11
Ian
2

Ich verwende Homebrew unter OSX 10.7 und es war so einfach wie das Ausführen dieser beiden Befehle:

brew install leptonica
brew install tesseract

Dies installierte Leptonica 1.68 und Tesseract 3.01 mit ihren Abhängigkeiten

shig
quelle
0

Eine Befehlslösung für mich arbeiten:

sudo brew install tesseract

Dadurch werden tesseract und alle Abhängigkeiten installiert. sudo notwendig für einige zwecke, wie jpeg paket verknüpfung.

user3291575
quelle