Als «wget» getaggte Fragen

11
Wie kann man fehlende "zuletzt geänderte" Header umgehen?

Ich laufe wgetso: wget --mirror --adjust-extension --convert-links --no-cookies http://tshepang.net -o log-main Ich bekomme eine Reihe dieser Nachrichten: Last-modified header missing -- time-stamps turned off. Ich nehme an, das bedeutet, dass Seiten immer wieder heruntergeladen werden, obwohl ich...

10
Erhalten von md5 während wget

Ich mache wgetriesige Dateien (über 100 GB) und vergleiche dann meine md5sum mit der Summe, die im Repository veröffentlicht wurde. Ob Sie es glauben oder nicht, es md5sumdauert nicht unerheblich lange, bis eine Datei dieser Größe ausgeführt wird. Daher möchte ich die Summe parallel zum Download...

9
wget unterstützt https nicht

Ich möchte https://example.commit dem wgetBefehl herunterladen , aber es steht "nicht unterstütztes / nicht erkanntes Protokoll". Ich habe versucht, das zu verwenden, --secure protocol=''aber das funktioniert nicht. Ich habe die TAR-Datei von GNU wget heruntergeladen und versucht, sie zu...

9
Laden Sie nur die ersten Bytes einer Quellseite herunter

Ich lade die HTML-Quellseite einer Website mit dem cURLBefehl herunter . Das Problem ist, ich möchte nicht die meisten Inhalte auf der Seite. Ich brauche nur die ersten 100 Zeilen der Quellseite. Gibt es eine Möglichkeit, den Download der Seite nach den ersten Zeilen zu stoppen? Derzeit...

8
Sagen Sie wget, dass die Spinnen-URL nicht zu einem Muster passt?

Ich möchte testen, wie sich meine Website beim Spinnen verhält. Ich möchte jedoch alle URLs ausschließen, die das Wort "Seite" enthalten. Ich habe es versucht: $ wget -r -R "*page*" --spider --no-check-certificate -w 1 http://mysite.com/ Das -RFlag soll ein URL-Muster ablehnen, das das Wort "Seite"...

8
Wie kann wget den Webseiteninhalt in einer Datei speichern?

Ich versuche, mit wget den Text einer Webseite zu speichern. Ich renne: wget "http://www.finance.yahoo.com/q/op?s=GOOG" > goog.txt um zu versuchen, die Webseite in goog.txt zu speichern, aber stattdessen sagt mir wget: Saving to: `op?s=GOOG' Warum verhält sich wget so und wie kann ich das...