Identifizierung
Ich habe dieses Tool gefunden, mit dem Sie PDF / A-Dateien identifizieren können. Es heißt DROID (Digital Record and Object Identification) . Es basiert auf Java und kann über eine GUI oder die Befehlszeile ausgeführt werden.
Auszug
DROID ist ein Software-Tool, das von The National Archives entwickelt wurde, um die automatische Stapelidentifizierung von Dateiformaten durchzuführen. DROID wurde von der Abteilung für digitale Aufbewahrung im Rahmen seiner umfassenderen Aktivitäten zur digitalen Aufbewahrung entwickelt und wurde entwickelt, um die grundlegenden Anforderungen eines digitalen Repositorys zu erfüllen, um das genaue Format aller gespeicherten digitalen Objekte identifizieren und diese Identifikation mit einem zentralen Register verknüpfen zu können von technischen Informationen über dieses Format und seine Abhängigkeiten.
Da es vom Nationalarchiv gesponsert wird, würde ich annehmen, dass es das richtige Werkzeug dafür ist, angesichts des beabsichtigten Zwecks des PDF / A-Formats. Das Projekt ist auch Open Source und der Code ist auf Github verfügbar und in binärer Form auf der Website des National Archives verpackt .
Validierung & Konvertierung
Wenn Sie nach einem Tool suchen, mit dem Sie Validierung und Konvertierung durchführen können, kann PDFBox dies meiner Meinung nach . PDFBox listet die PDF / A-Validierung direkt auf der Startseite ihrer Website auf. Es ist eine andere Java-Anwendung 8-).
Auszug aus der Website
PDF / A-Validierung
Validieren Sie PDFs anhand des PDF / A-ISO-Standards.
Im Abschnitt Befehlszeilentools links auf der Hauptseite wird die folgende Verwendung für das Tool angezeigt:
$ java -jar pdfbox-app-x.y.z.jar org.apache.pdfbox.ConvertColorspace [OPTIONS] <inputfile> <outputfile>
veraPDF ist ein weiteres Tool zur Validierung von PDF / A; Es ist Teil des Referenz-Tool-Sets der Open Preservation Foundation. Es ist auch eine Java-Anwendung.
Umwandlung
Für die einfache Konvertierung habe ich diese Methode in einem Blog-Beitrag mit dem Titel " Kostenlose Möglichkeit zum Konvertieren einer vorhandenen PDF-Datei in PDF / A" gefunden , bei der die folgenden Tools verwendet werden:
- Nur Ghostscript 8.64.
- PDFBox 0.7.3
- pdfmarks (Datei zur Bereitstellung zusätzlicher Metadaten)
- PDFA_def.ps
- USWebCoatedSWOP.icc
Mit den oben genannten Anweisungen verwenden Sie den folgenden Befehl:
$ gs -sDEVICE=pdfwrite -q -dNOPAUSE -dBATCH -dNOSAFER \
-dPDFA -dUseCIEColor -sProcessColorModel=DeviceCMYK \
-sOutputFile=Out_PDFA.pdf PDFA_def.ps pdfmarks IN_PDF.pdf
Es ist nicht ohne Warzen. Der Artikel beschreibt einen von ihnen und korrigiert die Druckflags auf Hyperlinks, die einer von ihnen sind. Der Artikel enthält eine Java-Anwendung, mit der Sie folgende Probleme beheben können:
$ java FixPrintFlag Out_PDFA.pdf New_verifiablePDFA.pdf
Es ist nicht schön, scheint aber praktikabel zu sein. Weitere Informationen finden Sie im Artikel .
Verweise
pdfmarks
?Zur Identifizierung von Dateien ist der Befehl
file
häufig hilfreich. In Ihrer Datei wird nach magischen Zahlen, Dateikennungen, Codierungsinformationen usw. gesucht, um hilfreiche Informationen zu erhalten.Im speziellen Fall von PDF-Dateien ist der Dienstprogramm
pdfinfo
besonders nützlich. In meinem Fall handelt es sich um eine Gentoo-Distribution, die mitpoppler
einer PDF-Rendering-Bibliothek ausgestattet ist.quelle
pdfinfo -meta
und das Betrachtenxmpmeta/RDF/Description/conformance
scheint zu sagen, ob das PDF PDF / A ist (dieser Knoten istA
) oder nicht (der Knoten existiert nicht oder hat einen anderen Wert). Es ist ein Anfang!Hier ist ein Bash-Befehlszeilenskript, das genau das tut:
Speichern Sie es in einer Datei namens pdf2pdfa.sh, die sich in Ihrem Pfad befindet, und rufen Sie es dann folgendermaßen auf:
pdf2pdfa.sh input.pdf
Es wird input_a.pdf erstellt.
quelle
input
? Ich verstehepdf_input
, aber was istinput
? (3) Sie sollten Shell-Variablen immer zitieren, es sei denn, Sie haben einen guten Grund, dies nicht zu tun , und Sie sind sicher , dass Sie wissen, was Sie tun. Bitte antworten Sie nicht in Kommentaren; Bearbeiten Sie Ihre Antwort, um sie klarer und vollständiger zu gestalten.