Die wget
Manpage gibt dies unter dem Abschnitt für den --random-wait
Parameter an:
Some web sites may perform log analysis to identify retrieval
programs such as Wget by looking for statistically significant
similarities in the time between requests. [...]
A 2001 article in a publication devoted to development on a popular
consumer platform provided code to perform this analysis on the
fly. Its author suggested blocking at the class C address level to
ensure automated retrieval programs were blocked despite changing
DHCP-supplied addresses.
Ich möchte eine Kopie dieses Artikels zum Lesen erhalten und habe viele Suchanfragen im Internet durchgeführt, um den Artikel zu ermitteln. Bei diesen Suchanfragen kann ich jedoch nur die Manpage finden, wget
die auf verschiedenen Websites gehostet wird. und einige andere Forschungsarbeiten, die überhaupt keinen Bezug zu diesem Thema haben.
Weiß jemand, auf welchen Artikel verwiesen wird und wo ich eine Kopie erhalten kann?
wget
man
documentation
user2064000
quelle
quelle
Antworten:
Auch wenn dies keine direkte Antwort ist,
git blame
undgit log
zeigen Sie, dass dieser Abschnitt in Commit 2c41d783 von einem Committer namenshniksic
Hrvoje Niksic eingeführt wurde. Seine E-Mail-Adresse finden Sie in derChangeLog
Datei von wget (ich werde sie aus offensichtlichen Gründen hier nicht veröffentlichen). Ich würde vorschlagen, ihn direkt zu fragen, da er möglicherweise der Beste ist, um eine angemessenere Antwort zu geben. Währenddessen könnten Sie ihn fragen, ob es ihm etwas ausmachen würde, die Manpage entsprechend zu aktualisieren. ;)quelle
Ich denke, es könnte dieser Artikel sein:
Erstellen aussagekräftiger Daten aus Webprotokollen mit Basis-SAS
Es gibt einen Absatz über das Blockieren von Bereichen der Klasse C:
Und eine Erwähnung
wget
in der Zeichenfolgen-basierten Blockierung von Benutzeragenten:Es war das fünfte Ergebnis in Googeln für "Log Analysis Wget" für das Jahr 2001 .
quelle