Gibt es eine Möglichkeit, einen Schnappschuss einer gesamten Website von der Wayback-Maschine herunterzuladen?
Ich bin mir bewusst, dass wir wget verwenden können, um alte Websites von Wayback Machine wiederherzustellen (z. B. wget -np -e robots=off --mirror --domains=staticweb.archive.org,web.archive.org http://web.archive.org/web/19970708161549/http://www.slackworks.com/
), aber ich frage mich, ob dies direkt von der Wayback Machine-Website aus möglich ist.
archive.org
Franck Dernoncourt
quelle
quelle
wget
, benötigen Sie einige weitere Parameter, z. B.--recursive --no-clobber --page-requisites --html-extension --convert-links
CSS, JS und natürlich Bilder.Antworten:
Es ist nicht möglich, einen Schnappschuss direkt von der Wayback-Maschine herunterzuladen, da dies in den Nutzungsbedingungen nicht zulässig ist .
Aus ihren FAQs :
quelle
Ich bin auf dasselbe Problem gestoßen und habe am Ende einen Ruby-Edelstein codiert.
Installieren:
Führen Sie dann
wayback_machine_downloader
die Basis-URL der Website aus, die Sie als Parameter abrufen möchten (z. B. example.com):Weitere Informationen: https://github.com/hartator/wayback-machine-downloader
quelle
wget
Lösung.Es gibt einen Dienst, der aus dem Webarchiv http://waybackdownloader.com heruntergeladen werden kann
quelle
Ich habe ein Skript zum Herunterladen der gesamten Site erstellt:
quelle
Vielleicht können Sie einen Wayback-Downloader wie http://www.waybackmachinedownloader.com oder http://www.waybackmachinedownloads.com ausprobieren
Beide dieser beiden Websites verfügen über eine kostenlose Demo, mit der Sie einige Seiten von der Archiv-URL entfernen können, um sicherzustellen, dass das Skript funktioniert.
Es gibt andere Tools, aber ich habe sie nicht getestet, daher kann ich kein Feedback geben.
quelle