Wie kann man HTML-Strukturen (herunterladen und) in EPUB (oder ein anderes für den Sony PRS-505-Reader geeignetes Format) konvertieren?
Meine Frage ist nicht, wie man eine einzelne HTML-Datei in eine EPUB-Datei konvertiert, da dies einfach ist; Ich meine, ich habe einige Bücher, die ich auf meinem Sony PRS-505 lesen möchte, und diese Bücher sind meistens im HTML-Format online, aber mit vielen verknüpften Seiten, und es gibt eine Seite mit dem Inhaltsverzeichnis, wie dieses Beispiel http: / /www.edge.org/documents/ThirdCulture/d-Contents.html
... oder manchmal ist es etwas komplizierter, da das Inhaltsverzeichnis nur die Kapitel auflistet und in den Kapiteln Links zu Unterkapiteln vorhanden sind, wie in diesem Beispiel: http: SLASHSLASHwww.hyw.com/Books/WargamesHandbook/ Contents.htm (Ich kann jetzt nur noch 1 Hyperlink b / c der Benutzerbeschränkung posten, deshalb gibt es SLASHSLASH anstelle von //)
Ich möchte diese und einige andere Beispiele mit korrekten Kapiteln, Bildern und einigen akzeptablen Formatierungen usw. konvertieren, also möchte ich im Grunde ein richtiges eBook aus dem HTML-Baum machen.
Was ist der einfachste Weg?
Antworten:
Ich verwende wget, um Webseiten rekursiv herunterzuladen (normalerweise Online-HTML-Handbücher). Sobald ich das HTML in einem Ordner habe, konvertiere ich es mit Calibre in das Format meiner Wahl .
quelle