Website-Downloader (Cache?) Zum Offline-Anzeigen von Websites

9

Gibt es eine tragbare Möglichkeit, alle Seiten einer Website herunterzuladen oder zwischenzuspeichern, um sie offline anzuzeigen? Ich habe morgen einen Überlandflug und möchte einige Webseiten (insbesondere die Python-Dokumentseite ( http://docs.python.org/ ) und die Pyqt-Referenz ( http: // www. ) Zwischenspeichern können . riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html ).

Idealerweise hätte ich gerne ein Firefox-Add-On oder ähnliches, aber alles funktioniert einwandfrei, solange ich es unter Linux ausführen kann.

Falmarri
quelle
Sie können diesen Offline-Website-Downloader ausprobieren .
Menelaos Vergis

Antworten:

15

Ich benutze HTTrack .

Sie können eine World Wide Web-Site aus dem Internet in ein lokales Verzeichnis herunterladen, rekursiv alle Verzeichnisse erstellen und HTML, Bilder und andere Dateien vom Server auf Ihren Computer übertragen

Edgar
quelle
Ich habe diese in der Vergangenheit verwendet, schöne kostenlose Lösung.
MaQleod
1
HTTrack ist das Beste für Linux und Windows und es gibt eine riesige Liste von Optionen, um den Download-Prozess zu konfigurieren. Ich liebe es
eslambasha
Ich habe es auch benutzt; Sie bieten jetzt auch eine Android-Version an.
Gparyani
-1 Es werden nicht "alle Verzeichnisse" erstellt, es werden nicht alle "Bilder und andere Dateien" abgerufen. Es wird nur das abgerufen, mit dem verknüpft ist.
Barlop
6

Ich verwende wget mit diesen Optionen, um eine Site für die Offline-Verwendung zu spiegeln

wget -cmkE -np http://example.com/a/section/i/like

wo

-m aktiviert die Spiegelungsoptionen zum lokalen Spiegeln einer Site

-c setzt einen vorherigen Download fort, falls ich bereits einige Seiten heruntergeladen habe

-k konvertiert absolute href so, dass sie für die Offline-Anzeige auf lokale verweisen

-E stellt sicher, dass Dateien nach dem Download die Erweiterung .html haben.

-np lädt nur Objekte unter / a / section / i / herunter und speichert nicht die gesamte Site zwischen.

Zum Beispiel wollte ich Süddokumentation herunterladen, aber keine Südtickets usw.

wget -cmkE -np http://south.aeracode.org/docs/index.html

Ich benutze Windows und führe wget auf cygwin aus, aber es gibt auch einen nativen Windows-Wget-Port .

In Ihrem Fall können Sie Python-Offline-Dokumente aus dem Abschnitt "Python-Dokumente" herunterladen

Meitham
quelle
1

Probieren Sie http://www.downthemall.net/ ein Firefox-Plugin aus. Ich habe es verwendet, um 250 Seiten PDFs in mehr als 20 separaten Dateien herunterzuladen. Es ist extrem mächtig. Es verfügt über eine Platzhalter- / Abfragesyntax, mit der Sie chirurgisch nur die gewünschten Dateien und keine der irrelevanten Dateien abrufen können, die Sie nicht verwenden.

Rolnik
quelle
1

Einige mir bekannte Firefox-Erweiterungen:

  • Sammelalbum

    hilft Ihnen beim Speichern von Webseiten und beim einfachen Verwalten von Sammlungen. Hauptmerkmale sind Leichtigkeit, Geschwindigkeit, Genauigkeit und mehrsprachige Unterstützung. Hauptmerkmale sind:

    • Webseite speichern
    • Speichern Sie einen Ausschnitt der Webseite
    • Website speichern
    • Organisieren Sie die Sammlung wie Lesezeichen
    • Volltextsuche und schnelle Filtersuche der Sammlung
    • Bearbeiten der gesammelten Webseite
    • Text- / HTML-Bearbeitungsfunktion, die den Notizen von Opera ähnelt
  • ScrapBook Plus

    Unterschied zwischen ScrapBook Plus und ScrapBook:

    • schnellere Sortierung
    • schnellerer Import und Export
    • Öffnen Sie das Fenster, um Ihre Sammlung direkt über die Seitenleiste zu verwalten
    • vereinfachte die Handhabung des "Kombinationsassistenten"
    • Neue Funktionen für "Mehrere URLs erfassen" (Filter zum Ausschließen von Links, Titel der Website oder Titel des Links als neuen Titel für den Eintrag in der Seitenleiste verwenden, Wartezeit zwischen 0 und 3 Sekunden für den Download angeben, UTF-8 verwenden oder ISO-8859-1 als Zeichensatz)
    • neues "Capture" -Fenster (Download muss manuell gestartet werden, automatisches Scrollen deaktiviert)
    • 6 Textmarker im Editor
  • UnMHT

    Mit dieser Option können Sie Dateien im MHTML-Webarchivformat (MHTML) anzeigen und vollständige Webseiten, einschließlich Text und Grafiken, in einer einzigen MHT-Datei speichern

  • Pocket (keine Erweiterung; eine integrierte Firefox-Funktion)

    Mit dieser Funktion können Sie Webseiten und Videos mit nur einem Klick in Pocket speichern. Pocket entfernt Unordnung und speichert die Seite in einer sauberen, ablenkungsfreien Ansicht, sodass Sie unterwegs über die Pocket-App darauf zugreifen können.

    Beachten Sie, dass:

    Für das Speichern in und den Zugriff auf Ihre Pocket-Liste in Firefox ist eine Internetverbindung erforderlich. Die Offline-Anzeige ist auf anderen Geräten mit der Pocket-App möglich.

galacticninja
quelle
0

Sie können eine ganze Website oder einen Teil einer Website mit wget herunterladen.

wget -r http://docs.python.org/

Im wget-Handbuch finden Sie weitere Optionen, die Sie möglicherweise übergeben möchten, z. B. um die Bandbreitennutzung zu begrenzen, die Rekursionstiefe zu steuern, Ausschlusslisten einzurichten usw.

Ein anderer Ansatz für das Offline-Surfen ist die Verwendung eines Caching-Proxys. Wwwoffle verfügt über zahlreiche Funktionen, die die Aufbewahrung für das Offline-Surfen erleichtern, z. B. das Überschreiben von vom Server angegebenen Ablaufdaten und eine rekursive Funktion zum Vorabrufen . (Ich benutze wwwoffle seit meinen Einwähltagen.)

Gilles 'SO - hör auf böse zu sein'
quelle