Zuerst müssen Sie diese Bilder optimieren. Ich empfehle ein Batch-Tool wie XnViewMP, das kostenlos und plattformübergreifend ist.
Es hat einen Datei-Explorer. Wählen Sie alle Ihre Bilder aus und gehen Sie zu Extras - Stapelkonvertierung . Fügen Sie Aktionen wie ich hinzu:
Hier sind meine Aktionen:
- HLS - machen Sie es Graustufen:
- Farbton: 0
- Leichtigkeit: 0
- Sättigung: -127
- Pegel - senken Sie den Schwarzpegel etwas, damit das graue Rauschen verschwindet
- Schwarzpunkt: 0
- Weißpunkt: 212 - kann je nach Bild variieren
- Lärmminderung Filter
- Zum Erhöhen des Kontrasts
anpassen
- Helligkeit: 0
- Kontrast: 127 - das ist wichtig
- Gamma: 1,06
- Minimum, um das Schwarz dicker zu machen
- Filtergröße: 5x5 - kann je nach Bild variieren
Vergessen Sie nicht, unter zu speichern tiff
(siehe Registerkarte Ausgabe ). Danach renne ich tesseract
:
tesseract test.tif text -psm 7
Hinweis Ich habe den PSM-Modus 7 ausgewählt: Behandle das Bild als einzelne Textzeile. Wenn Sie mehrere Zeilen haben, müssen Sie wahrscheinlich Modus 6 oder 3 verwenden.
Und hier ist der Inhalt der text.txt
Ausgabedatei:
570 394 666 638 043
Ich habe versucht, Ihr Bild mit der OCR-Technologie von ABBYY zu erkennen :
Weitere Informationen zu den Produkten von ABBYY finden Sie unter abbyy.com .
Ich arbeite für ABBYY und bin bereit zu helfen, wenn Sie Fragen haben.
quelle
quelle