So generieren Sie Trainingsdaten für OCR

7

Ich versuche, ein optisches Zeichenerkennungssystem zum Erkennen des Kennzeichens (indonesisches Kennzeichen) aufzubauen. Leider ist kein Trainingssatz verfügbar, aber ich habe die Schriftart gefunden. Ich versuche, die Trainingsdaten zu generieren, indem ich das Bild des Kennzeichens mit Kerneln zusammenfalte (etwas wie Gaußsche Unschärfe, Box-Unschärfe) mit Python, aber es ähnelt nicht echten Daten, hier ist die Schriftart wie folgt: Geben Sie hier die Bildbeschreibung ein

und ich möchte einen individuellen Brief generieren, der so aussieht:

plat kendaraan

Haben Sie eine Idee, wie Sie Trainingsdaten wie im obigen Bild generieren können? Vielen Dank

Kiki Rizki Arpiandi
quelle
Was ist mit dem Erstellen eines Datensatzes? Wofür wird Ihr System verwendet? Können Sie unbeschriftete Daten leicht erhalten?
Martin Thoma
Es ist schwierig, einen Datensatz zu erhalten, selbst wenn der Datensatz nicht beschriftet ist. Der Datensatz sollte ein beschnittenes Bild des Autokennzeichen-Lizenzschreibens sein. Das System wird zum Lesen der Kennzeichen verwendet
Kiki Rizki Arpiandi,
Ich benutzte ein tiefes Faltungs-Neuronales Netzwerk zum Klassifizieren von Ziffern, eine Strichbreitentransformation zum Erkennen des Textes und eine k-Mittel-Clustering-Textsegmentierung
Kiki Rizki Arpiandi

Antworten: