In den Google Webmaster-Tools habe ich festgestellt, dass meine Startseite zweimal indiziert wurde:
example.com/
example.com/?chocaid=397
Ich weiß, dass ich dies mithilfe des Verbindungstyps beheben könnte canonical
, aber ich frage mich: Woher kommt dieser Parameter?
Es gibt verschiedene Websites, auf denen Seiten mit genau diesem Parameter / Wert indiziert sind: https://duckduckgo.com/?q=chocaid%3D397 .
Ich habe nach Ähnlichkeiten zwischen diesen Websites gesucht. konnte aber keine schlüssige finden: Es ist oft die Titelseite, aber nicht in jedem Fall. Einige sind NSFW, aber nicht alle. Wenn die URL einer Domain diesen Parameter hat, haben ihn oft auch andere Subdomains derselben Domain.
Beispiele
Wikipedia-Eintrag
Microsoft Codeplex
url
url-parameters
unor
quelle
quelle
?chocaid=397
dann indiziert zu werden, verlinkt vermutlich etwas darauf, damit Google den Link überhaupt findet??chocaid=397
könnte aber eine Art Versuch sein, mit Hashes zu spielen (ich weiß nicht viel darüber, daher bin ich mir jedoch nicht sicher). Auch das ist eine gute Frage.Antworten:
Wie neu ist Ihre Domain? Es kann sehr gut sein, dass dies eine beliebte Abfrage für die alte Domain war und Sie daher immer noch "Besucher" erhalten. Ist diese Karte einer gültigen Seite oder einer 404 zugeordnet? Wenn Sie dort viele Treffer erhalten und es sich um eine 404 handelt, würde ich sie Ihrer Homepage oder so etwas neu zuordnen (verwenden Sie einen .htaccess).
quelle
canonical
, aber diese Frage bezieht sich mehr auf den Ursprung dieses Parameters.Möglicherweise versucht Googlebot, auf jQuery / Javascript zuzugreifen und alles zu crawlen, was es kann. Es gab kürzlich einen Beitrag von jemandem, der um Hilfe bat, weil Googlebot ungültige URLs auf seiner Website durchsuchte. John M antwortete darüber, wie Googlebot möglicherweise nach weiteren URLs sucht, die aus Skripten auf seiner Website gecrawlt werden können. Er arbeitet für Google Webmaster Tools. Sie haben Ihre eigene Frage so ziemlich beantwortet, indem Sie das kanonische Tag gesetzt haben.
quelle
Obwohl ich keine eindeutige Antwort habe, habe ich einige Dinge gefunden, die mir dabei helfen könnten, sie einzugrenzen:
Meine beste Vermutung wäre, dass es eine Scraper-Site gibt / gab, die diese URL zu allen gefundenen Links hinzufügt. Sicherlich scheinen externe Links die wahrscheinlichste Erklärung dafür zu sein, woher sie stammen, und Verzeichnisse sind unwahrscheinlich, da sie ganz zufälligen Seiten hinzugefügt werden.
quelle
Dies könnte von einem Anzeigenanbieter stammen, den Sie möglicherweise haben. Ich habe das gleiche Problem und der einzig mögliche Ort, von dem es stammt, ist von einem Adprovider, der Malware über die Javascript-Codes injiziert.
quelle