Rekursives HTML in PDF

12

Ich habe einen Ordner mit dieser Struktur:

/main-folder
 /index.html
 /subfolder1
    /index1.html
    /file1.html

mit vielen Unterordnern und nur HTML-Dateien ... Ich möchte alle mit nur einem Befehl oder einem einfachen Skript, das nicht alle Dateinamen erfordert, in PDF konvertieren.

Kennst du einen?

Matteo Pagliazzi
quelle

Antworten:

15

Ich würde vorschlagen, das WKHtmlToPDF-Tool von http://wkhtmltopdf.org/ zu installieren (verschoben von: http://code.google.com/p/wkhtmltopdf/ ).

Sie können dann in den Stammordner wechseln und mit find und xargs konvertieren:

cd /main-folder
find . -name \*.html | sed 's/.html$//g' | xargs -n 1 --replace=X wkhtmltopdf X.html X.pdf

Dadurch wird mit jeder HTML-Datei eine PDF-Datei erstellt.

dan_linder
quelle
Ich löste mit einer Liste von Dateien und einer Bash für, aber das ist viel besser!
Matteo Pagliazzi
5

Der folgende Befehl sollte die Aufgabe für einen Link übernehmen:

gnome-web-print http://www.ubuntu.com ubuntu.pdf

Für mehrere Links sollte es nicht schwierig sein, eine Schleife zu schreiben, die jeden Link einzeln behandelt.

jcollado
quelle