Evernote führt OCR für die Bilder durch, die Sie dort gespeichert haben. Gibt es eine Möglichkeit, das Volltextäquivalent für ein Bild in Evernote abzurufen, oder dient die Texterkennung nur zum Suchen?
Die Evernote-API verfügt über Funktionen zum Abrufen von Text und Rechteck, in denen dieser Text im Bild enthalten ist. Weitere Informationen finden Sie unter http://evernote.com/about/developer/api/evernote-api.htm . Informationen zum Abrufen finden Sie unter "Evernote Recognition Index XML-Format". Das Problem ist, dass sie keine traditionelle OCR ausführen. Ihr OCR-Algorithmus kann unterschiedliche Wörter für ein einzelnes "Wort" auf dem Bild erzeugen. Alles, wofür sie es verwenden, ist die Suche. Dies ist für sie in Ordnung, aber nicht für die Verwendung als Erkennungsmodul. (Obwohl sie Ihnen Gewicht für jedes Wort Alternative geben, können Sie das vielleicht verwenden)
Außerdem entscheidet Evernote anscheinend nicht, dass ein bestimmtes Bild genau einem Wort entspricht - z. B. stellt Evernote nicht fest, dass ein bestimmtes Bild "Hinweis" ist und nicht "fällig". Vielmehr werden beide nachverfolgt, und bei der Suche nach einem der beiden wird dasselbe Bild zurückgegeben. Daher gibt es keine Möglichkeit, ein Volltextäquivalent zu erhalten, da Evernote nicht entscheidet, was der Volltext tatsächlich ist, sondern nur, was er sein könnte.
evernote zahlt dem Schöpfer des OCR-Materials eine anständige Summe ODER bezahlte eine anständige Summe, um etwas zusammenzubauen. Daher bezweifle ich wirklich, dass Sie den extrahierten Text erhalten (+ Positionierung auf dem Bild).
(könnte ein Geschäftsmodell sein, um Bilder anderer Leute zu scannen und gute Ergebnisse zu liefern :))
Die Antwort lautet also: Nein.
Ich bin mir nicht sicher, wie viel Raffinesse Sie benötigen, aber da ich auch Adobe Acrobat verwende, klicke ich einfach mit der rechten Maustaste auf meinen Evernote-Anhang, um ihn mit Acrobat zu öffnen.
Wählen Sie dann in Acrobat "Dokument | OCR-Texterkennung" und speichern Sie das Dokument als Nur-Text.
Dies funktioniert gut für mich, da ich nur eine gelegentliche OCR-Konvertierung benötige.
quelle
Wenn Sie alle Bilder aus Evernote herausholen könnten, könnten Sie die Texterkennung mit Google Text & Tabellen durchführen.
Sie können einen Ordner mit Bildern in Google Text & Tabellen hochladen und in Dokumente konvertieren, die sowohl das Bild als auch den OCR-Text enthalten.
Sie können dann alle diese Dokumente im Batch-Download als Nur-Text herunterladen, wodurch das Bild entfernt wird.
Wenn Sie alle Evernote-Bilder mit einem Hash versehen (z. B.
md5
), sollte es einfach sein, aus Google Text & Tabellen heruntergeladene Nur-Text-Dateien mit dem Originalbild zu verknüpfen.quelle
Ich arbeite unter Windows und verwende Adobe Acrobat Pro und Word.
quelle