Ich suche seit einiger Zeit bei Google, kann aber keine Antwort auf meine Frage finden.
Ich habe unerwünschte OCR-Ebenen in einem Dokument, das ich kürzlich mit Adobe Acrobat gescannt habe. Es wurde nicht richtig OCRed und ich möchte einige Informationen redigieren, aber die OCR sorgt dafür, dass die gewünschten Informationen gelöscht werden. Ich habe die Dateien in TIFs konvertiert, aber einen (sehr) signifikanten Qualitätsverlust festgestellt. Ich habe gehört, dass das Drucken in ein anderes PDF entweder den Text beibehält oder die Bildqualität verringert.
Ich freue mich über jede Hilfe bei der Lösung dieses Problems so schnell wie möglich.
Danke.
quelle
Nach vielen Experimenten stellte ich fest, dass beim Drucken in Adobe PDF von Adobe Acrobat das Dokument ohne OCR und ohne Qualitätsverlust gedruckt wird (eine auf den ersten Blick nicht wahrnehmbare Auflösung geht verloren).
Viele Websites behaupten jedoch, dass dies nicht funktioniert. Ich habe auch die anderen Drucker wie Foxit Reader und OneNote ausprobiert, aber die Qualität war reduziert. Auch JPEG war das gleiche.
Bitte beachten Sie, dass Ihr Kilometerstand variieren kann.
Hinweis: Ich lasse diesen Thread als unbeantwortet markiert, in der Hoffnung, eine bessere Antwort als meine zu finden.
quelle
(vor einem Jahr...)
Wenn die Dokumente beispielsweise gescannt und nicht aus Word als PDF gedruckt werden, können Sie sie mit Adobe ganz einfach entfernen:
Wählen Sie Dokument, Dokument untersuchen und jetzt können Sie den versteckten Text (OCR) entfernen.
quelle
In Acrobat Pro: Verwenden Sie "Versteckte Informationen entfernen" (unter "Schutz"). Alles auswählen, ausführen, OCR ist weg
quelle
In Acrobat X gibt es unter "Schutz" eine Schaltfläche "Dokument bereinigen", mit der ALLES entfernt wird, was jedoch sichtbar ist (einschließlich der OCR-Textebene), und das Dokument in eine reduzierte Bitmap konvertiert wird.
quelle
Ich habe ein Tool für diesen kostenlosen PDF Redactor erstellt . Wenn Sie das Bild hochladen und einfach auf "Redigieren" klicken, wird Ihr PDF reduziert und die OCR entfernt. Wenn Sie möchten, können Sie auch Redaktionsmarkierungen auf das Dokument zeichnen.
quelle