Aus Wikipedia
reCAPTCHA ist ein System, das CAPTCHA verwendet, um den Text von Büchern zu digitalisieren und Websites vor Bots zu schützen
Ich habe viele gescannte Dokumente, die ich konvertieren möchte, und möchte ein Captcha auf meiner Website einführen. Warum also nicht zwei Fliegen mit einer Klappe schlagen?
Das reCAPTCHA-Projekt hat seine eigene Agenda, konzentriert sich jedoch auf Archive der New York Times und Bücher von Google Books.
Gibt es ein ähnliches Projekt, das ich hosten und damit die digitalisierten Bücher / Dokumente diktieren könnte?
Antworten:
Verwenden Sie die OCR von Google , um diese Bücher zu digitalisieren. Für die Verwendung Ihrer eigenen Bücher zum Übersetzen steht derzeit keine Software von Drittanbietern zur Verfügung. Als zusätzliche Begründung hierzu ein Auszug aus der CAPTCHA-Site;
Außerdem sprach er auf einer TED-Konferenz zum Thema reCAPTCHA. Wenn Sie tatsächlich beabsichtigen, Ihre eigenen zu machen, können Sie auch studieren.
quelle