PDF aus HTML-Buch erstellen

16

Es gibt einige Websites, die Bücher als HTML-Seiten bereitstellen (z. B. juristische Dokumente).

Was kann ich verwenden, um aus diesen Seiten ein PDF-Buch zu erstellen, basierend auf der bereits vorhandenen Struktur?

In Windows gibt es Adobe Professional (kommerzielle Software). Ich vermute, dass Linux etwas frei hat? Eine Lösung mit Skripten wäre für mich in Ordnung.

Lucian Sasu
quelle

Antworten:

9

Calibre ist ein ziemlich leistungsfähiges Tool zum Konvertieren von Dingen in E-Books in verschiedenen Formaten. Erhältlich in einem Software Center in Ihrer Nähe!

Lassen Sie sich nicht von der weniger als schönen Benutzeroberfläche täuschen, sie kann viel bewirken.

Oli
quelle
1
Kaliber kommt auch mit einem Kommandozeilen-Tool, ebook-convert. Damit könnten for file in *.html ; do ebook-convert "$file" "${file%.html}.pdf" ; doneSie also alle HTML-Dateien im Ordner in PDF konvertieren.
Frabjous
1
Dies ist ein gutes Tool. Ich bin auch ein Calibre-Benutzer. Ich denke, das neueste Tool hat deutliche Verbesserungen in der Benutzeroberfläche.
Sabacon
4

Der einfachste Weg? Datei> Drucken über Ihren Browser. Wählen Sie als Ihren Drucker Print to File aus , und es wird Sie fragen, wo Sie es möchten. Stellen Sie sicher, dass Sie PDF markieren. Klicken Sie auf "Drucken" und es wird tatsächlich auf Ihrem Laufwerk gespeichert, anstatt tatsächlich zu drucken.

Jacob Peddicord
quelle
Vielen Dank. Es gibt jedoch viele Dateien. Dieses Manöver ist praktisch unmöglich.
Lucian Sasu
4

Htmldoc kann nützlich sein, siehe hier; http://www.htmldoc.org/ ist im Software-Center erhältlich. Leider hat die 1.8-Version ein Problem mit Unicode-codierten Dateien, aber in vielen Fällen kann es immer noch ein Retter sein. Das Problem wurde in der 1.9-Entwicklungsversion behoben.

Normalerweise verwende ich hier die wundervolle Erweiterung für das Sammelalbum. http://amb.vis.ne.jp/mozilla/scrapbook/ für Firefox, um die Webseiten zu erfassen, verwenden Sie die Bearbeitungstools in Scrapbook, um sie zu reparieren, wenn dies erforderlich ist, und verwenden Sie dann htmldoc, um alle Seiten in PDF zu konvertieren.

Sabacon
quelle
3

Sie könnten versuchen, http://www.xhtml2pdf.com/ . Es ist ein Konverter für HTML / XHTML und CSS in PDF. Alles in Python geschrieben.

Nichod
quelle
3

Ich würde empfehlen, OpenOffice / LibreOffice zu verwenden, um das PDF zu erstellen. Als Test habe ich das Wget-Manul heruntergeladen (alles auf einer Seite) und dann die HTML-Seite in OponOffice geöffnet und auf die Schaltfläche "Direkt in PDF exportieren" geklickt. Es erstellte die PDF mit einem Index aus dem Inhaltsverzeichnis.

In der Vergangenheit war dies die einfachste Möglichkeit, HTML-Seiten in PDF-Dateien zu konvertieren. Sie können damit auch ohne großen Aufwand Änderungen vornehmen.

Screenshots:

  • Wget-Handbuch mit Open Office als PDF exportiert Wget-Handbuch mit Open Office als PDF exportiert

  • Option Direkt in PDF exportieren in Open Office Option Direkt in PDF exportieren in Open Office

SiliconChaos
quelle
Ideen, wenn das Buch nicht auf einer Seite, sondern in mehrere Kapitel / Abschnitte aufgeteilt ist?
Ciprian Tomoiagă
2

Ich habe tatsächlich für die Kaliberlösung gestimmt. Aber hier ist eine andere, die Sie versuchen könnten. Installieren Sie AbiWord . Es kann Konvertierungen zwischen allen Formaten durchführen, die es von der Befehlszeile kennt. So konvertieren Sie alle HTML-Dateien in einem Ordner in PDF-Dateien:

for file in *.html ; do abiword --to=pdf "$file" ; done

Für Typografie auf höherer Ebene (aber wahrscheinlich komplizierter) wäre PrinceXML eine weitere Option .

schäbig
quelle
2

Abhängig vom zu druckenden HTML-Dokument erzielen Sie mit pandoc möglicherweise die besten Ergebnisse . Dies ist einer der vielseitigsten HTML-zu-LaTeX-Konverter. Die resultierende .tex- Datei kann mit oder ganz einfach in PDF umgewandelt werden . Viele Optionen stehen zur Verfügung, wenn Sie sich mit LaTeX-Syntax und -Paketen befassen möchten. Dies funktioniert möglicherweise nicht richtig, wenn eingebettete Bilder und ausgefallene HTML-Stile beibehalten werden sollen.xelatexpdflatex

Loevborg
quelle
1

In google-chrome können Sie eine PDF-Datei für eine ganze Site erstellen, indem Sie eine Erweiterung verwenden. Ich persönlich verwende die Web2PDF Converter-Erweiterung , die ein PDF mit nur einem Klick erstellt.

Hier ist ein Screenshot dieses Plugins von der Google Extensions-Website.

Bildbeschreibung hier eingeben

Außerdem können Sie ein von mir mit diesem Tool erstelltes PDF anzeigen, indem Sie das nächste herunterladen (Rechtsklick, Ziel speichern unter): http://geppettvs.servehttp.com/resources/askubuntu-com.pdf (einige Browser wie google- In Chrome können Sie dies möglicherweise online anzeigen.

Wenn Sie die von der Erweiterung erstellten PDF-Dateien bearbeiten möchten, um die von der Erweiterung am unteren Rand jeder Seite platzierte digitale Signatur zu entfernen, oder um andere Elemente zu entfernen, gehen Sie folgendermaßen vor: Entfernen von Textinformationen aus einer PDF-Datei?

Viel Glück!

Geppettvs D'Constanzo
quelle