Ich möchte eine gute Menge an Papieren, die ich herumliegen habe, mit dem geringstmöglichen Aufwand scannen. Ich möchte sie mit Simple Scan in Bilder konvertieren und sie dann mit OCR in Text konvertieren. Gibt es eine gute OCR-App mit einer grafischen Benutzeroberfläche, die auf Knopfdruck gute Ergebnisse liefert?
77
Antworten:
GOCR from ist ein OCR-Programm (Optical Character Recognition). Es konvertiert gescannte Textbilder zurück in Textdateien.
CLARA ist eine weitere gute grafische Option.
OCRAD from is a OCR kann als eigenständige Konsolenanwendung oder als Backend für andere Programme verwendet werden.
KOOKA von ist eine KDE-Anwendung, funktioniert aber einwandfrei. Außerdem müssen Sie aktuelle OCR-Programme wie GOCR und OCRAD installieren. Nach der Installation von Kooka und den OCR-Programmen müssen Sie Kooka auf den OCR-Installationsort verweisen, damit Kooka installiert werden kann Konvertieren Sie das JPEG in Text.
OCRFeeder von ist ein System zur Analyse des Dokumentenlayouts und zur optischen Zeichenerkennung.
Tesseract aus ist Befehlszeilenprogrammund es ist sehr einfach zu use.You Sprachpaket installieren können tesseract-ocr-ger von hier .
Schauen Sie sich diese Seite an .
Hinweis:
Um tesseract goto terminal auszuführen, geben Sie Folgendes ein
Tesseract kann nur eine TIFF-Datei lesen - wenn Sie eine JPEG- oder PDF-Datei haben oder was auch immer, müssen Sie sie konvertieren. Außerdem muss die Dateinamenerweiterung .tif und nicht .tiff lauten, da sonst Fehler behoben werden.
quelle
tesseract
(3.04.00 unter Ubuntu 15.10) hat keine Probleme mitPNG
Eingabedateien. Es akzeptiertJPG
Dateien, liefert aber schlechtere Ergebnisse, als man es von zusätzlichen Komprimierungsartefakten erwarten würde.Es gibt nur wenige gängige OCR-Befehlszeilentools, die Sie verwenden können (ich bin mir nicht sicher, ob sie über eine grafische Benutzeroberfläche verfügen):
Tesseract ( ReadMe , FAQ ) (Python)
Auch verfügbar für: Tesseract .NET , Tesseract iOS
Verwendungszweck:
GOCR
OCRopus ™ ( FAQ ) (geschrieben in Python, NumPy und SciPy)
Tessnet2 (Open Source, Texterkennung , Tesseract, .NET, DOTNET, C #, VB.NET, C ++ / CLI)
Einige andere: ABBYY CLI OCR für Linux , Asprise OCR
Eine vollständige Liste finden Sie unter: Liste der optischen Zeichenerkennungssoftware bei Wikipedia
Siehe auch:
wanghaisheng/awesome-ocr
- Eine kuratierte Liste vielversprechender OCR-Ressourcen bei GitHub.quelle
Linux-Intelligent-Ocr-Lösung
Haftungsausschluss - Ich bin eng mit der Entwicklung dieser Open Source-Lösung verbunden
Lios kann Ausdrucke mit einem Scanner oder einer Kamera in Text umwandeln.
Es kann auch Text aus gescannten Bildern aus anderen Quellen wie PDF, Bild oder Ordner mit Bildern erzeugen.
Das Programm ist für Sehbehinderte uneingeschränkt zugänglich.
Da ich eng verbunden bin, würde ich mich über Feedback freuen.
quelle
Gscan2PDF
OCR auf mehrseitigen PDF- oder gescannten Dokumenten
Dies ist wahrscheinlich der einfachste Weg. Gscan2pdf ist ein grafisches Tool, mit dem Sie nicht nur Dateien scannen, sondern auch Dateien importieren und OCR ausführen können. Installieren Sie gscan2pdf von hier aus über das Ubuntu Software Center oder führen Sie diesen Befehl in einem Terminal aus:
Gscan2PDF kann anpassbare OCR-Engines verwenden, Standard ist
tesseract-ocr
Sie können die entsprechende Sprache auswählen. In diesem Fall müssen Sie das
tesseract-ocr-LANG
Paket installieren , in demLANG
sich der aus drei Buchstaben bestehende ISO 639-2-Sprachcode befindet. Im Moment haben Sie 108 Sprachen auf 16.04 Repo.quelle
Ich hatte gerade Erfolg (unter 16.04) mit pdfocr.rb . Dies ist im Ubuntu-Wiki aufgeführt
Hier ist ein ppa, aber das Repository für 16.04 wird nicht aktualisiert. Das obige Ruby-Skript von Github funktioniert allerdings noch mit 16.04.
Sie können es von Github herunterladen. Sie müssen die folgenden Pakete installiert haben:
Dann machte pdfocr.rb ausführbar und lief:
Optional können Sie den
-l LANG
Parameter verwenden. In diesem Fall müssen Sie dastesseract-ocr-LANG
Paket installieren , in demLANG
sich der aus drei Buchstaben bestehende ISO 639-2-Sprachcode befindet. Im Moment haben Sie 108 Sprachen auf 16.04 Repo.quelle
Der beste und einfachste Weg, es zu benutzen
pypdfocr
, ändert das PDF nicht. pypdfocr ist hier ein Link zum Python-Modul.Am Ende haben Sie einen anderen,
your_document_ocr.pdf
wie Sie es mit durchsuchbarem Text wollen. Die App ändert die Bildqualität nicht. Erhöht die Größe der Datei ein wenig, indem der Overlay-Text hinzugefügt wird.Ich denke, der Befehl ist ziemlich einfach, da er keine GUI benötigt. Vielleicht ist die Installation von pypdfocr etwas ausführlicher:
Update 3. November 2018:
pypdfocr
wird seit 2016 nicht mehr unterstützt und ich habe einige Probleme festgestellt, weil ich nicht betreut wurde.ocrmypdf
( Modul erledigt einen ähnlichen Job und kann wie folgt verwendet werden:Installieren:
oder
quelle
Nur weil es sehr gut funktioniert und auf jeden Fall in der Liste stehen sollte:
gimageReader
Beispiel aus einem Screenshot:
Es ist in den Repos (beantwortet am 18.10, benutze es aber schon seit Ewigkeiten)
quelle
eng
als Option aufgeführt ... aber ich habe es ausgearbeitet! :) Laufensudo apt install tesseract-ocr-eng
im Terminal hat den Trick gemacht. Es wäre schön, wenn dies in der Hilfedatei von gimageReader oder "README" auf github ... oder irgendwo dokumentiert wäre. Wie hier vielleicht.gscan2pdf enthält 3 verschiedene OCR-Motoren. Sie können direkt in das Programm scannen oder Ihr PDF in das Programm importieren. Ich habe festgestellt, dass die Tesseract-Engine großartig funktioniert und sehr einfach zu bedienen ist
quelle