wget rekursiv auf untergeordnete Elemente des URL-Pfads beschränkt

10

Ich möchte die folgende Subdomain mit der rekursiven Option herunterladen, indem ich wget:

www.example.com/A/B

Wenn diese URL also Links zu www.example.com/A/B/Cund enthält www.example.com/A/B/D, sollten diese beiden ebenfalls heruntergeladen werden.

Ich möchte jedoch nicht, dass etwas außerhalb der www.example.com/A/BSubdomain heruntergeladen wird. Zum Beispiel, wenn www.example.com/A/B/Cein Link zu hat www.example.com, die Seite www.example.comsollte nicht heruntergeladen werden.

Welchen wgetBefehl soll ich verwenden?

Paul S.
quelle

Antworten:

9

Verwenden Sie die --no-parentOption in wget:

--no-parent

Steigen Sie beim rekursiven Abrufen niemals in das übergeordnete Verzeichnis auf. Dies ist eine nützliche Option, da dadurch garantiert wird, dass nur die Dateien unterhalb einer bestimmten Hierarchie heruntergeladen werden.

nneonneo
quelle
Ah, das ist was ich suche. Die wget-Optionen sind so zahlreich, dass ich sie nicht finden konnte. :)
2

Verwenden Sie die -IOption, um das Verzeichnis anzugeben, das in den Download aufgenommen werden soll:

wget -r -I www.example.com/A/B/C,www.example.com/A/B/D
user22644
quelle