Kann Acrobat 11 OCR mit mehreren CPU-Kernen ausführen?

8

Die OCR-Verarbeitung braucht Zeit. Die Verwendung mehrerer CPU-Kerne würde die Verarbeitung beschleunigen. Acrobat 10 war keine Multithread-Anwendung . Wie wäre es mit Acrobat 11? Verwendet 11 standardmäßig OCR mit mehreren CPU-Kernen (falls verfügbar)? Wenn nicht, gibt es Problemumgehungen, z. B. Skripte, mit denen Acrobat 11 OCR mit mehreren CPU-Kernen ausführen kann? Entweder über die in Acrobat integrierte Skriptsprache oder über externe Skripts, mit denen mehrere einzelne Thread-Instanzen von Acrobat gestartet und parallel zu Teilen des Verarbeitungsjobs geleitet werden.

Hinweis: Diese Frage ist nicht zu lokalisiert (nicht auf einen bestimmten Zeitpunkt beschränkt), da (1) Adobe nicht sehr oft neue wichtige Acrobat-Versionen veröffentlicht (Acrobat 10 wurde vor zwei Jahren veröffentlicht) und (2) Adobe Acrobat weit verbreitet ist gebrauchte Anwendung.

Tarcman.
quelle

Antworten:

6

Ich habe die Acrobat 11 (XI) -Test in VirtualBox installiert . Acrobat 11 ist Single-Threaded.

Ich habe auch ein externes Skript erstellt, das mehrere Acrobat-Instanzen startet (eine pro CPU-Kern), den OCR-Job parallel verarbeitet und das Ergebnis zusammenführt. Ein entscheidender Schritt besteht darin, die Fehlerprotokollierung in den Acrobat-Einstellungen zu aktivieren, alle .log-Dateien zu analysieren und alle Fehlerdateien erneut zu verarbeiten. Das Skript (bei Verwendung von 4 Kernen) führt die OCR immer noch zweimal schneller aus als die Standardeinstellung von Acrobat 11.

Tarcman.
quelle
4
Sie können einfach die Quelle angeben, wenn Sie möchten. Wenn sie es wagen, es zu entfernen, kann es leicht wiederhergestellt werden.
Joey
Wenn Sie zufällig dieselbe Person sind, die die Frage gestellt hat, sollten Sie Ihre beiden derzeit nicht registrierten Konten mit einem neuen, registrierten Konto zusammenführen. Sie können beginnen , hier , und lesen Sie auch diese für weitere Informationen. Danach können Sie Ihre Frage nach Belieben ändern.
Indrek
Ich versuche nichts zu behindern. Da Sie ständig die Benutzernamen wechseln, wurden Ihre Änderungen anscheinend von einem Dritten vorgenommen, der die ursprüngliche Frage nicht zu verstehen schien. Wenn Sie Ihre eigene Frage beantworten möchten, sollten Sie die Frage schreiben und alle gleichzeitig beantworten.
Isaac Rabinovitch
Ich habe Ihre (nicht registrierten) Konten vorerst zusammengeführt. Wir bitten Sie jedoch, keine Einweg-E-Mail-Adresse zu verwenden, sondern sich auf unserer Website zu registrieren, damit Sie angemeldet bleiben, Ihre Fragen kommentieren usw. können. Außerdem wird nichts entfernt, nichts, worüber Sie sich Sorgen machen müssen. Beachten Sie nur, dass anonyme Änderungen immer strenger überprüft werden.
Slhck
1
@tarcman Gibt es eine Möglichkeit, dein Skript zu veröffentlichen? Ich bin sicher, es gibt viele Leute, die daran interessiert wären, es zu benutzen
Jason
1

Multithreading muss in eine Anwendung integriert werden. Der Entwickler muss Code schreiben, der Threads erstellt und die Aufgabe in Unteraufgaben aufteilt, die jedem Thread zugewiesen werden können. Wenn die Entwickler von Acrobat dies für ihren OCR-Erkennungscode nicht tun, kann der Benutzer die erforderliche zusätzliche Logik nicht erstellen.

Isaac Rabinovitch
quelle
2
Wenn es auf Seitenbereiche angewendet werden kann, könnten Sie wahrscheinlich versuchen, die Arbeit in mehrere Prozesse aufzuteilen, wobei jede OCR nur wenige Seiten umfasst und anschließend die Ergebnisse wieder zusammenführt.
Joey
0

Um alle Kerne für OCR zu verwenden, sollten Sie sich den PDF-Exchange-Editor ansehen. Die OCR-Engine scheint alle Kerne auf meinem System zu verwenden. Sobald Sie dieses Leistungsniveau erreicht haben, ist es sinnvoll, eine SSD zu verwenden.

Es muss eine Windows-Optimierung geben, die dazu führt, dass mehr CPU-Zeit für eine einzelne Thread-Anwendung reserviert wird, die nicht an E / A gebunden ist. Auf meinem System wird Acrobat nicht durch die Festplattenleistung verlangsamt, aber die meiste CPU-Zeit, die ich zum Erstellen eines Index bekomme, beträgt ungefähr 30%.

Seien wir ehrlich, Acrobat ist eine weit verbreitete, aber schlecht geschriebene Anwendung. Acrobat Pro bietet einige Funktionen, die Sie (noch) nirgendwo anders finden können.

Len
quelle