Gute kostenlose OCR mit GUI zur Korrektur von Fehlern? (für Windows)

9

Ich habe SimpleOCR verwendet , das eine schöne Benutzeroberfläche zum Korrigieren von Fehlern hat. Leider macht es viele Fehler! (und leidet unter anderen Fehlern und Einschränkungen)

Auf der anderen Seite ist Tesseract genauer, hat aber überhaupt keine grafische Benutzeroberfläche.

Meine Frage ist, gibt es ein kostenloses OCR-Programm für Windows, das eine schöne Benutzeroberfläche und eine niedrige Fehlerrate hat? Ich möchte, dass verdächtige Wörter hervorgehoben werden (durch OCR-Unsicherheit, nicht nur Rechtschreibprüfung) und das ursprüngliche Wort (Bitmap) angezeigt wird, während ich das OCR-Wort ähnlich wie SimpleOCR bearbeite.

Open Source ist am besten, gefolgt von Freeware und Test / Demo / Crippleware.

SimpleOCR-Screenshot mit der grafischen Benutzeroberfläche zur Korrektur von Fehlern

Hugh Allen
quelle
Mögliches Duplikat der kostenlosen OCR-Software
Sathyajith Bhat
2
@Sathya: Meine spezifischen Anforderungen unterscheiden es von dieser Frage.
Hugh Allen
Nicht gerade kostenlos, aber haben Sie sich mit Microsoft Office befasst? Es kommt mit OCR. (Suchen Sie im Setup nach der Funktion "Microsoft Office Document Imaging".)
Vivelin
@ Horsedrowner: Ich habe es gerade versucht. Die Genauigkeit ist mit der von Tesseract vergleichbar, erfordert jedoch eine TIFF-Datei mit der entsprechenden DPI-Einstellung oder funktioniert nicht und verfügt über keine Schnittstelle zur Korrektur von OCR-Fehlern.
Hugh Allen
@ Hugh Allen: Tut es? Es hat ziemlich gut funktioniert, als ich auf die Kontextmenüfunktion in OneNote 2007 gestoßen bin. Und ich habe eine zufällige Bilddatei verwendet, die von einer Website
kopiert wurde

Antworten:

2

Haben Sie Gimagereader ausprobiert , eine GUI- Front für Tesseract?

Ukanth
quelle
Ich habe es gerade versucht (unter Windows) und es läuft nicht für mich - der Prozess wird sofort ohne Fehlermeldung beendet :( Wie auch immer, wenn man sich die Screenshots ansieht, scheint es nicht das Wort hervorzuheben, das Sie bearbeiten. Haben Sie es versucht? es?
Hugh Allen
2

OCRopus :

Die Software basiert teilweise auf Tesseract, der derzeit besten Open-Source-OCR-Engine. Das Projekt wird voraussichtlich Ende nächsten Jahres veröffentlicht und für das Buchscanprojekt von Google verwendet. Das Team hat jedoch einige interessante Anwendungen im Auge:

  • eine Web-Service-Schnittstelle
  • PDF-, Kamera- und Bildschirm-OCR
  • Integration mit Desktop-Suchwerkzeugen: Beagle, Spotlight, Google Desktop

OCRopus (tm) ist ein hochmodernes Dokumentenanalyse- und OCR-System mit steckbarer Layoutanalyse, steckbarer Zeichenerkennung, statistischer Modellierung natürlicher Sprache und mehrsprachigen Funktionen.

Die OCRopus-Engine basiert auf zwei Forschungsprojekten: einem Hochleistungs-Handschrifterkenner, der Mitte der 90er Jahre entwickelt und vom US-Volkszählungsbüro eingesetzt wurde, und neuartigen Hochleistungs-Layout-Analysemethoden.

OCRopus ist eine Entwicklung, die von Google gesponsert wird und ursprünglich für die Konvertierung von Dokumenten mit hohem Durchsatz und hohem Volumen gedacht ist. Wir erwarten, dass es auch für viele andere Anwendungen ein hervorragendes OCR-System sein wird. Alt-Text Links:


GOCR

GOCR ist ein OCR-Programm (Optical Character Recognition), das unter der GNU Public License entwickelt wurde. Es konvertiert gescannte Textbilder zurück in Textdateien. Jörg Schulenburg hat das Programm gestartet und leitet nun ein Entwicklerteam. GOCR kann mit verschiedenen Frontends verwendet werden, was die Portierung auf verschiedene Betriebssysteme und Architekturen sehr einfach macht. Es kann viele verschiedene Bildformate öffnen und seine Qualität hat sich täglich verbessert. Alt-Text Alt-Text

Links:


Krazy_Kaos
quelle
Haben beide eine anständige Benutzeroberfläche?
Hugh Allen
1
Bearbeitet, beantworte deine Frage ... aber ich würde sagen: "Nein, das tun sie nicht", aber ich höre, dass abiword OCRopus unterstützt ( arstechnica.com/open-source/news/2007/08/… )
Krazy_Kaos
1
+1 für das Hinzufügen von Screenshots zur Beantwortung und auch für die Mini-Überprüfung der beiden angebotenen Programme ...
Kurt Pfeifle
0

Es gibt auch TOPOCR (auch bekannt als SnapReader), das die Rechtschreibprüfung für 11 Sprachen nachbearbeitet:

Mit SnapReader können Sie aus fast jedem Dokumentbild Ihre eigenen durchsuchbaren Notizen erstellen. Sie können es auch als Authoring-Tool verwenden und mit Ihrem Scanner oder Ihrer Kamera eigene bearbeitbare Inhalte erstellen und die Ergebnisse als HTML oder PDF speichern. SnapReader kann mit Audrey auch Text in Audio von sehr hoher Qualität umwandeln. Sie können also nicht nur Ihren Scanner oder Ihre Kamera zum Erfassen von Dokumenten verwenden, sondern auch Ihren tragbaren Musik-Player oder Ihr Smartphone verwenden, um sie zu "lesen".

Bild

harrymc
quelle