Ich möchte HTML- Dateien herunterladen (Beispiel: http://www.brpreiss.com/books/opus6/ ) und diese mit einer HTML- Datei oder einem anderen Format verbinden, das ich für den E-Book-Reader verwenden kann. Websites mit kostenlosen Büchern haben kein Standard-Paging, sie sind keine Blogs oder Foren, also wissen Sie nicht, wie man ein automatisches Crawlen und Zusammenführen durchführt.
ebook
web-crawler
Hrvoje Hudo
quelle
quelle
Früher habe ich das mit Calibre gemacht.
Das wurde mir allerdings zu mühsam, deshalb habe ich eine Chrome-Erweiterung gebaut, um es einfacher zu machen.
Es heißt EpubPress ( http://epub.press ).
Hiermit können Sie aus Ihren Chrome-Registerkarten ein eBook erstellen.
Hoffentlich hilft das!
quelle
Pandoc kann einen Link zu einer Seite (oder einer HTML-Datei) erstellen und in pdf / epub konvertieren ...
Ich bin nicht sicher, ob es kriechen würde. Wenn dies nicht der Fall ist, können Sie die Seiten zuerst mit wget oder etwas crawlen (oder einfach nur Links sammeln) und an pandoc weitergeben.
quelle
Sie können https://getpocket.com und das Taschenrezept im Kaliber verwenden, das über das Menü "Nachrichten abrufen" zugänglich ist.
quelle
HTTrack ist eine gute Option - es wird ein eBook von einer Website erstellt: Es kann hier heruntergeladen werden: https://www.httrack.com/ Mit HTTrack können Sie eine World Wide Web-Site aus dem Internet auf eine lokale Website herunterladen Verzeichnis, rekursives Erstellen aller Verzeichnisse, Abrufen von HTML, Bildern und anderen Dateien vom Server auf Ihren Computer. HTTrack ordnet die relative Linkstruktur der ursprünglichen Site an. "
Anschließend können Sie den HTML-Code mithilfe von Calibre oder einer anderen Konvertierungssoftware von HTML zu Epub in EPUB, AZW3 oder PDF konvertieren.
Eine zweite Möglichkeit, direkt in EPUB zu konvertieren, ist EpubPress: Es gibt Erweiterungen, die die Verwendung von Firefox (nur v44.0 +) oder Chrome ermöglichen. Um diese Software nutzen zu können, müssen Sie ein Browserfenster öffnen. Jede Registerkarte ist im Wesentlichen ein "Kapitel" in Ihrem eBook. Ordnen Sie die Registerkarten in der gewünschten Reihenfolge an und aktivieren Sie dann epubpress. Dadurch werden die Registerkarten im .epub-Format in der angegebenen Reihenfolge heruntergeladen und angeordnet. Hoffe das hilft!
* Beachten Sie jedoch, dass EpubPress einzelne Webseiten herunterlädt - bei HTTrack keine "Website". Um eine Website mit EpubPress herunterzuladen, müssen Sie jeden Link auf der Website als separaten Tab öffnen und dann Epubpress verwenden, um diese Links im .epub-Format zu sammeln.
quelle