Ich möchte eine große Anzahl gescannter Papierformulare (GUI oder Befehlszeile) verarbeiten. Ich möchte nur (benutzerdefinierte) Kontrollkästchen lesen. Das Formular sieht folgendermaßen aus:
- Jede Linie hat 6 kreisförmige Kästchen (eines ist markiert)
- Form hat mehr als 45 Zeilen
Nach der Verarbeitung möchte ich den geprüften Wert (1… 6) jeder Zeile haben. Ich gehe davon aus, da es keine Optical ist Character Recognition beteiligt (aber OMR ), sollte dies etwas einfacher sein.
Gibt es eine Möglichkeit, dies über die GUI oder die Befehlszeile zu tun? Was wäre der beste Ansatz?
AKTUALISIERT : Scans kommen in PDF oder JPEG (meine Wahl). Beispielscan (380 KB JPEG).
Hier ist eine anonymisierte Version des Formulars:
Antworten:
Wenn Sie OCR vermeiden möchten, können Sie ImageMagick (ein Super-Toolset zur CLI-Bildmanipulation) verwenden. Sie müssen jedoch darauf achten, dass alle Seiten genau gleich ausgerichtet sind. Ich habe diesen Workflow zusammen gehackt. Sie müssen ihn an Ihre Bedürfnisse anpassen und einige Schleifen erstellen, aber er kann Ihnen in die richtige Richtung helfen.
Stellen Sie sicher, dass die Position jeder Runde auf jedem Blatt gleich ist
Extrahiere jede Runde und speichere sie mit dem row_circle-nr (wie 04_1.png, 04_2.png usw.)
Berechnen Sie die Rotfläche mithilfe von Histogrammen ( ich bevorzuge Rot, aber Sie können dies auch für Schwarz tun ).
Der größte
REDVALUE
gewinnt für jede ReiheNun, das ist es.
Wie installiere ich imagemagick?
Die Verwendung und Installation von ImageMagick kann einschüchternd sein, aber dieses Bildmanipulationspaket ist das leistungsstärkste, das mir bisher begegnet ist. Da die Installation von der Quelle für native OS X-Benutzer problematisch sein kann, empfehle ich Ihnen, Homebrew zu verwenden .
Um ImageMagick mit Homebrew zu installieren , führen Sie diesen Oneliner in Ihrem Terminal aus:
Homebrew ist jetzt installiert. Es ist ratsam, den Vorschlägen des Installationsprogramms nach der Installation zu folgen. Jetzt installieren wir ImageMagick mit
brew
.Jetzt können wir imagemagick und sein
convert
Werkzeug wie in den obigen Beispielen verwenden.quelle
Ich bin ein Open-Source-Enthusiast und habe mir ImageMagic angesehen, um zu sehen, ob es sich um Open Source handelt. Das Projekt hat jedoch seinen Sitz in den USA. Ich möchte sehen, ob ich Ihnen mit einer Open-Source-Projektbasis der deutschen Universität namens SDAPS helfen kann.
SDAPS ist speziell ein OMR-Programm.
http://sdaps.org/SDAPS
Ich habe Ihre Testseite heruntergeladen und werde versuchen, sie zu verwenden, um mithilfe von SDAPS eine Antwort auf Ihre Frage zu geben.
quelle