Ich muss alle Gutenberg-eBooks im Nur-Text-Format (nicht HTML) und nur in englischer Sprache herunterladen.
Hat jemand Vorschläge, wie man sie alle vom Gutenberg-Server herunterlädt?
Ich brauche sie, um eine sprachliche Untersuchung durchzuführen.
quelle
--level=0
. Aber ich denke, Sie sollten besser erlauben, abzubrechen und neu zu starten: try--level 9999 --no-clobber
, wodurch Dateien, die Sie bereits haben, übersprungen werden (vorausgesetzt, Sie befinden sich immer noch im selben Ordner auf der Festplatte).--input-file
im Handbuch .-c
Option verwendet, aber immer noch. Ich habeoffset=xxx
die URL angegeben, die gespiegelt werden soll, aber sie wird immer noch von der ersten Seite heruntergeladen.Sie können die gesamte Gutenberg-Sammlung englischer Bücher und anderer Sprachen in einer einzigen ZIM-Datei herunterladen , die stark komprimiert ist und dann mit Kiwix sowohl auf dem Desktop als auch auf Android geöffnet werden kann . Die englischen Bücher sind 40 GB.
quelle
Die ausgewählte Antwort ist zwar korrekt, kann jedoch zwei Probleme verursachen:
wget
Befehl beim Herunterladen der Dateien von einem externen Spiegel keine rekursiven Prüfungen durchführt.Die folgende Lösung behebt diese Probleme:
Möglicherweise möchten Sie die Referrer- und User-Agent-Zeichenfolgen ändern, um eine gewisse Zufälligkeit zu erzielen.
quelle
ftp://mirrors.pglaf.org/mirrors/gutenberg-iso hat ein paar gute Möglichkeiten.
ftp://mirrors.pglaf.org/mirrors/gutenberg-iso/pgdvd042010.iso ist eine 8-GB-Datei, die für Ihre Anforderungen ausreichen sollte.
Weitere Informationen finden Sie hier:
https://www.gutenberg.org/wiki/Gutenberg:The_CD_and_DVD_Project#Downloading_Via_FTP bietet alle Optionen zum Herunterladen des Archivs, einschließlich FTP und BitTorrent.
quelle
Eine weitere Option ist das großartige Tool unter http://pgiso.pglaf.org/ .
quelle
Warum nicht all Ihre überkomplizierten und oben gezeigten Programmierkenntnisse und Kenntnisse nutzen, um eine einfache Schaltfläche zu erstellen, die all diese Aktionen miteinander verknüpft und "Alle aktuellen Bücher herunterladen" mit einer Registerkarte mit Sprachoptionen sagt, wenn Sie darauf klicken.
Ich bin mir sicher, dass die meisten Benutzer der Website E-Book-Sammler sind und das manuelle Herunterladen bestimmter Bücher zu Themen, die sie interessieren, für 1 oder 2 Bücher in Ordnung ist. Eine größere Sammlung manuell zu erstellen, ist jedoch ein Kinderspiel. Dennoch, wenn sie es für Recherchen benötigen oder einfach eine riesige digitale Bibliothek mit Büchern an ihrem eigenen PC besitzen möchten. Die meisten Leute sind ausgeschaltet und entfernen sich von der Site, wenn sie feststellen, dass sie ein Computerassistent sein müssen, um dies zu tun. Eine Schaltfläche "Alle aktuellen Bücher herunterladen" würde der Site des Projekts und seinen Benutzern zugute kommen, und sie wird mit Sicherheit produzieren Noch mehr Besucher auf der Website. So ist jeder glücklich.
quelle