Ich möchte die Metadaten einer gescannten PDF-Datei bearbeiten , um verschiedenen Seiten benutzerdefinierte Seitenzahlen zuzuweisen. Zum Beispiel: Was sind jetzt die Seiten 1-3, die ich möglicherweise als i, ii und iii bezeichnen möchte, und was sind die Seiten 4-10, die ich als 1-7 bezeichnen möchte. Ich möchte die aktuelle Reihenfolge der Seiten nicht ändern.
Gibt es eine Möglichkeit, dies mit kostenlosen Tools zu tun? und B) eine Möglichkeit, dies "im Batch" zu tun (ohne dass jede Seite manuell neu nummeriert werden muss).
software-recommendation
pdf
MarkovCh1
quelle
quelle
Antworten:
Hier eine Lösung basierend auf LaTeX. Es verwendet das
pdfpages
Paket, um das gescannte PDF (hier genanntscan.pdf
) einzuschließen . Die gewünschten PDF-Seitenbezeichnungen können mithilfe deshyperref
Pakets mitpdfpagelabels
aktivierter Option festgelegt werden. Es verwendet das normale\thepage
Makro als Beschriftung, mit der römische Kleinbuchstaben definiert werden können. Der Seitenzähler wird dann zurückgesetzt und auf normale Zahlen zurückgesetzt.Fügen Sie den obigen Code in eine Datei ein (zB
scan_mod.tex
) und kompilieren Sie ihn mitpdflatex
:Dies wird produzieren
scan_mod.pdf
. Besondere Anmerkungen inkl. Hyperlinks verschwinden. Dies sollte bei gescannten PDFs kein Problem sein.Wenn Sie dies öfter benötigen, können Sie ein Skript schreiben, das die Anzahl der römisch nummerierten Seiten und den Dateinamen als Argumente akzeptiert und eine Datei mit dem obigen Code erstellt, in der der Name und die Nummern Variablen sind, die dann kompiliert werden.
quelle
Sie können dies mit einem Texteditor tun.
Öffnen Sie, wie in der Antwort angegeben, eine PDF-Datei mit einem Texteditor, suchen Sie nach einem
/Catalog
Eintrag und fügen Sie einen Eintrag mit folgendem Namen hinzu/PageLabels
:Beachten Sie, dass die Seitenindizes (physische Seitenzahlen) mit beginnen
0
.Natürlich können Sie dies automatisch mit Skriptsprachen tun.
PDF-Standards - Seitenbeschriftungen sind detailliert spezifiziert.
quelle
jPDF Tweak ist ein grafisches Open Source-Dienstprogramm, das Seitennummerierung (der richtige Begriff ist "Seitenbeschriftung") und viele andere Anfänger- bis Fortgeschrittene-PDF-Bearbeitungsfunktionen bietet. Es läuft auf Ubuntu und anderen Betriebssystemen.
Die Dokumentationsseite enthält schrittweise Anweisungen.
quelle
Es gibt ein Tool namens PDF Mod, mit dem Sie die Seiten einer PDF-Datei kostenlos neu anordnen können.
Es kann vom Ubuntu Software Center in Ubuntu 10.10 und höher installiert werden.
So installieren Sie in Ubuntu 9.10 oder 10.04:
So installieren Sie Fügen Sie das ppa
ppa:pdfmod-team/ppa
zu Ihren Softwarequellen hinzu (so geht 's ) und installieren Sie pdfmod über das Software-CenterAngepasst von: http://www.webupd8.org/2011/03/edit-pdf-documents-in-linux-with-pdf.html
Viel Glück: D
quelle
Habe gerade einen Zeiger gefunden, den es dafür geben könnte
ghostscript
, hier:Habe pdftk - Lesezeichen zu pdf hinzufügen und bearbeiten - Unix und Linux - Stack Exchange # 18600 ; es bezieht sich auf links:Die obigen Ausführungen befassen sich jedoch mit Lesezeichen - nicht mit logischer Paginierung. Es ergibt sich aus pdfmarkReference.pdf , der erforderliche "Befehl" ist '
/Label
' (oder '/PAGELABEL
') - und es wird weiter auf PDFReference.pdf, Kapitel 8.3.1 "Seitenbeschriftungen" verwiesen. Leider wird in diesem Kapitel nicht unbedingt erklärt, wie PDF-Markierungen mit Seitenbeschriftungen verwendet werden können.... und weiter in diesem Thread:
BEARBEITEN: nur um dies zu zeigen - wenn Sie dies als
pdfmarks
Datei gespeichert haben:... und du rufst an:
... dann werden am Ende drei leere Seiten mit den
infile.pdf
Bezeichnungen -1, 0 und 1 angehängt :)Naja, vielleicht hilft das irgendwann, ein einfacheres
gs
Skript zum Umnummerieren von Seiten zu finden :)Prost!
EDIT2: Verstanden, ich denke - benutze den gleichen
gs
Befehl wie oben - und unten ist der Inhalt despdfmarks
Skripts, das die infile.pdf neu nummeriert, also beginnt es mit -1, 0, 1 ... Es ist im Grunde ein modifiziertes Beispiel von die PDF-Referenz (siehe Kommentare für mehr):quelle
Es gibt ein kleines Python-Skript, das diese Aufgabe übernehmen kann: https://github.com/lovasoa/pagelabels-py
In Ihrem Fall rufen Sie an:
quelle
Openoffice / Libreoffice kann den Trick mit der PDF-Import-Erweiterung und einem Paginierungsmakro machen.
Keine perfekte Lösung, aber es funktioniert für mich (abgesehen von der Verwendung von PDF Mod - was ich sehr empfehlen würde).
quelle
Versuchen Sie es mit pyPdf , einer Python-Bibliothek zum Bearbeiten von PDF-Dokumenten. Einige, aber nicht viele Programmierungen wären erforderlich.
Sie können sich auch PDFtk ansehen , obwohl ich nicht überprüft habe, ob es das Ändern der Seitenzahl für einzelne Seiten unterstützt. Beide sind als Pakete in Ubuntu verfügbar.
quelle
Es gibt eine andere App namens PDFEdit, die auf Source Forge gehostet wird. Source Forge-Projektseite - Dies ist jedoch nicht hilfreich, da nicht die von Ihnen benötigte Funktionalität vorhanden ist
quelle
pdfedit
KannCatalog/PageLabels
Dict anzeigen, wenn ein Dokument es hat, aber wenn es ausgewählt ist, heißt es: " Dieses Wörterbuch hat keine direkt bearbeitbaren Eigenschaften " ... Prost!