Es gibt einige Websites, die Bücher als HTML-Seiten bereitstellen (z. B. juristische Dokumente).
Was kann ich verwenden, um aus diesen Seiten ein PDF-Buch zu erstellen, basierend auf der bereits vorhandenen Struktur?
In Windows gibt es Adobe Professional (kommerzielle Software). Ich vermute, dass Linux etwas frei hat? Eine Lösung mit Skripten wäre für mich in Ordnung.
software-recommendation
pdf
html
Lucian Sasu
quelle
quelle
for file in *.html ; do ebook-convert "$file" "${file%.html}.pdf" ; done
Sie also alle HTML-Dateien im Ordner in PDF konvertieren.Der einfachste Weg? Datei> Drucken über Ihren Browser. Wählen Sie als Ihren Drucker Print to File aus , und es wird Sie fragen, wo Sie es möchten. Stellen Sie sicher, dass Sie PDF markieren. Klicken Sie auf "Drucken" und es wird tatsächlich auf Ihrem Laufwerk gespeichert, anstatt tatsächlich zu drucken.
quelle
Htmldoc kann nützlich sein, siehe hier; http://www.htmldoc.org/ ist im Software-Center erhältlich. Leider hat die 1.8-Version ein Problem mit Unicode-codierten Dateien, aber in vielen Fällen kann es immer noch ein Retter sein. Das Problem wurde in der 1.9-Entwicklungsversion behoben.
Normalerweise verwende ich hier die wundervolle Erweiterung für das Sammelalbum. http://amb.vis.ne.jp/mozilla/scrapbook/ für Firefox, um die Webseiten zu erfassen, verwenden Sie die Bearbeitungstools in Scrapbook, um sie zu reparieren, wenn dies erforderlich ist, und verwenden Sie dann htmldoc, um alle Seiten in PDF zu konvertieren.
quelle
Sie könnten versuchen, http://www.xhtml2pdf.com/ . Es ist ein Konverter für HTML / XHTML und CSS in PDF. Alles in Python geschrieben.
quelle
Ich würde empfehlen, OpenOffice / LibreOffice zu verwenden, um das PDF zu erstellen. Als Test habe ich das Wget-Manul heruntergeladen (alles auf einer Seite) und dann die HTML-Seite in OponOffice geöffnet und auf die Schaltfläche "Direkt in PDF exportieren" geklickt. Es erstellte die PDF mit einem Index aus dem Inhaltsverzeichnis.
In der Vergangenheit war dies die einfachste Möglichkeit, HTML-Seiten in PDF-Dateien zu konvertieren. Sie können damit auch ohne großen Aufwand Änderungen vornehmen.
Screenshots:
Wget-Handbuch mit Open Office als PDF exportiert
Option Direkt in PDF exportieren in Open Office
quelle
Ich habe tatsächlich für die Kaliberlösung gestimmt. Aber hier ist eine andere, die Sie versuchen könnten. Installieren Sie AbiWord . Es kann Konvertierungen zwischen allen Formaten durchführen, die es von der Befehlszeile kennt. So konvertieren Sie alle HTML-Dateien in einem Ordner in PDF-Dateien:
for file in *.html ; do abiword --to=pdf "$file" ; done
Für Typografie auf höherer Ebene (aber wahrscheinlich komplizierter) wäre PrinceXML eine weitere Option .
quelle
Abhängig vom zu druckenden HTML-Dokument erzielen Sie mit pandoc möglicherweise die besten Ergebnisse . Dies ist einer der vielseitigsten HTML-zu-LaTeX-Konverter. Die resultierende .tex- Datei kann mit oder ganz einfach in PDF umgewandelt werden . Viele Optionen stehen zur Verfügung, wenn Sie sich mit LaTeX-Syntax und -Paketen befassen möchten. Dies funktioniert möglicherweise nicht richtig, wenn eingebettete Bilder und ausgefallene HTML-Stile beibehalten werden sollen.
xelatex
pdflatex
quelle
In google-chrome können Sie eine PDF-Datei für eine ganze Site erstellen, indem Sie eine Erweiterung verwenden. Ich persönlich verwende die Web2PDF Converter-Erweiterung , die ein PDF mit nur einem Klick erstellt.
Hier ist ein Screenshot dieses Plugins von der Google Extensions-Website.
Außerdem können Sie ein von mir mit diesem Tool erstelltes PDF anzeigen, indem Sie das nächste herunterladen (Rechtsklick, Ziel speichern unter): http://geppettvs.servehttp.com/resources/askubuntu-com.pdf (einige Browser wie google- In Chrome können Sie dies möglicherweise online anzeigen.
Wenn Sie die von der Erweiterung erstellten PDF-Dateien bearbeiten möchten, um die von der Erweiterung am unteren Rand jeder Seite platzierte digitale Signatur zu entfernen, oder um andere Elemente zu entfernen, gehen Sie folgendermaßen vor: Entfernen von Textinformationen aus einer PDF-Datei?
Viel Glück!
quelle