Ich benutze, wget --mirror --html-extension --convert-links
um eine Site zu spiegeln, aber am Ende habe ich viele Dateinamen im Format post.php?id=#.html
. Wenn ich versuche, diese in einem Browser anzuzeigen, schlägt dies fehl, da der Browser die Abfragezeichenfolge beim Laden der Datei ignoriert. Gibt es eine Möglichkeit, das ?
Zeichen in den Dateinamen durch etwas anderes zu ersetzen ?
Die Antwort von --restrict-file-names=windows
hat korrekt funktioniert. In Verbindung mit den Flags --convert-links
und --adjust-extension
/ -E
(früher benannt --html-extension
, was ebenfalls funktioniert, aber veraltet ist) wird ein Spiegel erzeugt, der sich wie erwartet verhält.
wget --mirror --adjust-extension --convert-links --restrict-file-names=windows http://www.example
http://site.com/article.cgi?25
inarticle.cgi?25.html
Abschnitt 2.7 unter gnu.org/software/wget/manual/wget.html#HTTP-Optionswget hat keine Möglichkeit, den gespeicherten Namen zu ändern. Was Sie wahrscheinlich tun müssen, ist ein Skript zu erstellen, um es zu durchlaufen und zu ersetzen? mit _ oder so ähnlich. Wget allein kann das nicht.
quelle