Nach dem, was ich in meinen Serverprotokollen gelernt habe, gehören IP-Adressen, die mit 64.249 beginnen, zu Google. Wenn ich auf meinem Computer eine Host-Suche für Google durchführe, erhalte ich 11 verschiedene IP-Adressen, die alle mit 74.125.226 beginnen.
Ich gehe dann hier http://www.iplists.com/ und finde heraus, dass es eine Menge weiterer IP-Adressen für Google gibt.
Ich habe sogar eine Whois-Suche in einer Eingabeaufforderung für Google durchgeführt und festgestellt, dass die Suche nach 50 gefundenen Datensätzen abgebrochen wurde, zusammen mit einer ganzen Reihe von Servern mit ungewöhnlichen Namen wie GOOGLE.COM.ANGRYPIRATES.COM und GOOGLE.COM. AFRICANBATS.ORG. zusammen mit verschiedenen IP-Adressen, die ich vorher noch nicht gesehen habe, wie 91.218.229.20.
Was ich tun möchte, ist die Whitelist von echten Google IP-Adressen. Sollte ich einfach jede einzelne IP-Adresse, die ich bisher gefunden habe, auf die weiße Liste setzen, oder sollte ich andere Vorsichtsmaßnahmen treffen, bevor ich eine Google-Adresse auf die weiße Liste setze?
Ich möchte mich nicht darauf verlassen, dass andere nach IP-Adressen für mich suchen, z. B. die Quelle http://www.iplists.com/, da sich die IP-Adressen jederzeit ändern können und ich meine Whitelist regelmäßig aktualisieren möchte.
Antworten:
Aus den offiziellen Dokumenten zur Überprüfung von Googlebot / Google :
Beachten Sie, dass Google die Verwendung einer statischen "Whitelist" nicht empfiehlt .
(Hervorhebung meiner eigenen)
In den Google-Dokumenten finden Sie ein Beispiel:
https://support.google.com/webmasters/answer/80553?hl=de
quelle
Das wichtigste zuerst.
Es gibt zwei Domainnamen, über die wir sprechen. Google.com und Googlebot.com. Eine umgekehrte Suche nach Google.com wäre irreführend.
Hier ist eine Antwort, die ich vor einiger Zeit gegeben habe, als ich die IP-Adressen von Google überprüft habe, mit denen meine Website über 8 Jahre gecrawlt wurde. Dies ist nicht die A und O-Liste, könnte aber einen historischen Überblick geben.
Wofür verwendet Google IPs von 173.194.90.xxx? Warum ist es kein googlebot.com-Zeiger?
In dieser Liste sehen Sie, dass der angezeigte IP-Adressbereich 64.249 korrekt ist.
Ich habe eine schnelle Prüfung für diese Antwort durchgeführt. Dies ist meine aktuelle Whitelist für Googlebot (Agentenname). Bitte verzeihen Sie das Wildcarding. Ich habe meinen Code aktualisiert, um Bereiche effizienter zu verstehen, aber die Liste nicht aktualisiert. Es tut uns leid. In diesem Fall verwende ich nur einen einfachen regulären Ausdruck, um die IP-Adresse mit einem Minimum an Tricks mit der Liste zu vergleichen und das * durch etwas zu ersetzen, das Regex versteht. Ich kann eine IP-Adresse mit meinem Code mit der gesamten Liste vergleichen, damit sie immer noch schnell genug ist.
GOOGLE.COM.ANGRYPIRATES.COM und GOOGLE.COM.AFRICANBATS.ORG werden als Domain- oder Subdomain-Hack bezeichnet. Diese gehören überhaupt nicht zu Google. Dies kann jeder jederzeit mit jedem Domainnamen tun. Ohne auf die Details einzugehen, können Sie Informationen im Internet finden. Ich möchte dieses Verhalten nicht fördern, indem ich es hier erkläre.
quelle