Woher kommt der URL-Parameter "? Chocaid = 397"?

9

In den Google Webmaster-Tools habe ich festgestellt, dass meine Startseite zweimal indiziert wurde:

  • example.com/
  • example.com/?chocaid=397

Ich weiß, dass ich dies mithilfe des Verbindungstyps beheben könnte canonical, aber ich frage mich: Woher kommt dieser Parameter?

Es gibt verschiedene Websites, auf denen Seiten mit genau diesem Parameter / Wert indiziert sind: https://duckduckgo.com/?q=chocaid%3D397 .

Ich habe nach Ähnlichkeiten zwischen diesen Websites gesucht. konnte aber keine schlüssige finden: Es ist oft die Titelseite, aber nicht in jedem Fall. Einige sind NSFW, aber nicht alle. Wenn die URL einer Domain diesen Parameter hat, haben ihn oft auch andere Subdomains derselben Domain.

Beispiele

Wikipedia-Eintrag

Geben Sie hier die Bildbeschreibung ein

Microsoft Codeplex

Geben Sie hier die Bildbeschreibung ein

unor
quelle
Gibt es in den Google Webmaster-Tools (oder in Ihren Referer-Protokollen) Hinweise darauf, welche Seite möglicherweise mit dieser URL verknüpft ist?
MrWhite
@ w3d: Ich habe keinen Zugriff auf Protokolle. In GWT wurde es unter " HTML-Verbesserungen " → "Wiederholte Seitentitel" aufgeführt. Ich fürchte, ich kann keine Referrer-Informationen erhalten.
Unor
Ich habe mich nur gefragt, ob unter "Verkehr"> "Links zu Ihrer Website"> "Am meisten verlinkter Inhalt"> "Mehr" (um alle verlinkten Seiten abzurufen) etwas angezeigt wird. Um ?chocaid=397dann indiziert zu werden, verlinkt vermutlich etwas darauf, damit Google den Link überhaupt findet?
MrWhite
@ w3d: Ah, ich verstehe. Leider fehlen noch Daten für diesen Bericht (wahrscheinlich, weil ich GWT erst seit einigen Tagen verwende).
Unor
Ich bin mir nicht sicher, ob dies hilft, aber die Nummer 397 hat etwas mit Hashes zu tun (siehe hier und hier ). Ich bin mir nicht sicher, ob dies etwas mit dieser Frage zu tun hat, ?chocaid=397könnte aber eine Art Versuch sein, mit Hashes zu spielen (ich weiß nicht viel darüber, daher bin ich mir jedoch nicht sicher). Auch das ist eine gute Frage.

Antworten:

1

Wie neu ist Ihre Domain? Es kann sehr gut sein, dass dies eine beliebte Abfrage für die alte Domain war und Sie daher immer noch "Besucher" erhalten. Ist diese Karte einer gültigen Seite oder einer 404 zugeordnet? Wenn Sie dort viele Treffer erhalten und es sich um eine 404 handelt, würde ich sie Ihrer Homepage oder so etwas neu zuordnen (verwenden Sie einen .htaccess).

Kyros
quelle
1
Ich habe noch keine Besucher bemerkt; Ich habe die von Google indizierte Seite gesehen. Es wird derselben Startseite zugeordnet (als ob der Parameter weggelassen worden wäre). Ich weiß, dass ich es umleiten oder verwenden könnte canonical, aber diese Frage bezieht sich mehr auf den Ursprung dieses Parameters.
Unor
2
Dies erklärt jedoch nicht, warum derselbe URL-Parameter in den Suchergebnissen für viele andere Domänen angezeigt wird.
MrWhite
1

Möglicherweise versucht Googlebot, auf jQuery / Javascript zuzugreifen und alles zu crawlen, was es kann. Es gab kürzlich einen Beitrag von jemandem, der um Hilfe bat, weil Googlebot ungültige URLs auf seiner Website durchsuchte. John M antwortete darüber, wie Googlebot möglicherweise nach weiteren URLs sucht, die aus Skripten auf seiner Website gecrawlt werden können. Er arbeitet für Google Webmaster Tools. Sie haben Ihre eigene Frage so ziemlich beantwortet, indem Sie das kanonische Tag gesetzt haben.

Anagio
quelle
1

Obwohl ich keine eindeutige Antwort habe, habe ich einige Dinge gefunden, die mir dabei helfen könnten, sie einzugrenzen:

  • Die Links erscheinen auch in Bing und Yahoo, haben also nichts mit Google zu tun.
  • Sie erscheinen in Wikis, Tumblr-Blogs, Wordpress-Blogs und anderen Websites und werden daher nicht über einen Exploit in einer bestimmten Software hinzugefügt.
  • Sie erscheinen auf einigen Tumblr-Websites von sehr geringer Qualität, und daher ist es unwahrscheinlich, dass diese Werbung erhalten haben. Ebenso ist es unwahrscheinlich, dass Wikipedia-Artikel über Anzeigen beworben werden.

Meine beste Vermutung wäre, dass es eine Scraper-Site gibt / gab, die diese URL zu allen gefundenen Links hinzufügt. Sicherlich scheinen externe Links die wahrscheinlichste Erklärung dafür zu sein, woher sie stammen, und Verzeichnisse sind unwahrscheinlich, da sie ganz zufälligen Seiten hinzugefügt werden.

Richard B.
quelle
0

Dies könnte von einem Anzeigenanbieter stammen, den Sie möglicherweise haben. Ich habe das gleiche Problem und der einzig mögliche Ort, von dem es stammt, ist von einem Adprovider, der Malware über die Javascript-Codes injiziert.

Raymund
quelle
Haben Sie eine Quelle / einen Beweis dafür? Dies würde bedeuten, dass Wikipedia davon infiziert ist, da einige Wikipedia-Seiten mit diesem Parameter indiziert sind.
Unor
Ja, weil ich ein Blog habe, das Google aus diesem Grund blockiert hat, und nachdem die Täteranzeigen entfernt wurden, haben sie begonnen, den Block zu entfernen
Raymund