So extrahieren Sie die Bilddrehung aus einer PDF-Datei

1

Ich extrahiere alle Bilder aus einem Bündel gescannter PDFs mit pdfimages, um sie zu verarbeiten und neu zu verpacken.

Das Problem ist, dass einige Bilder um 90 ° gedreht sind (entweder im Uhrzeigersinn oder im Gegenuhrzeigersinn) und andere nicht. Die Original-PDF-Datei dreht sie erneut auf der Seite, sodass alle Seiten gerade angezeigt werden, die extrahierten Bilder jedoch gedreht bleiben.

Ich konnte keine Option pdfimagesfür die Ausgabe der Rotationen finden, sodass ich sie in einem Skript verwenden konnte.

Gibt es eine Möglichkeit, diese Informationen zu extrahieren?

Tobia
quelle

Antworten:

-1

Ich bin mir nicht sicher, ob Ihre PDFs mehrseitig sind. Wenn Sie also pdfTK oder pdfSAM verwenden , um sie in einseitige PDFs zu unterteilen, können Sie die Bilder mit The Gimp manuell drehen.

Sie könnten auch ein Tool wie ImageMagick verwenden, um die Drehung zu automatisieren, aber Sie müssten wahrscheinlich die normalen CW- und CCW-Bilder in verschiedene Ordner aufteilen.

David
quelle
Das eigentliche Problem ist die automatische Erkennung der Drehung, nicht das manuelle Drehen von Seiten / Bildern.
Thomas W.