Kürzlich habe ich festgestellt, dass Google URLs indiziert, die Argumente für die Abfragezeichenfolgen utm_campaign, utm_source und utm_medium enthalten. In den Ergebnissen zeigt Google URLs mit diesen Abfragezeichenfolgen anstelle der kanonischen URL an:
Ich verstehe, dass dies ein Problem mit "doppeltem Inhalt" sein könnte, aber ich habe das link rel=canonical
Tag auf meiner gesamten Website verwendet. Als ein Beispiel:
[snip]
<meta name="description" content="App store optimization helps discovery and rank on Google Play and the App Store. Publishers can use ASO by following these simple steps."/>
<meta name="robots" content="noodp"/>
<link rel="canonical" href="https://sweetpricing.com/blog/2016/11/app-store-optimization/" />
<meta property="og:locale" content="en_US" />
[snip]
Ich gehe davon aus, dass Google die kanonische URL für die Indizierung verwenden sollte. Was mache ich falsch?
google
canonical-url
serps
Brendon
quelle
quelle
site:stackexchange.com inurl:utm_campaign
liefert auch ähnliche Ergebnisse (in etwas größerem Maßstab). Beachten Sie auch, dasssite:
Suchvorgänge häufig nicht-kanonische URLs in den Ergebnissen zurückgeben, die normalerweise bei "normalen" Suchvorgängen nicht zurückgegeben werden. Die oben genannten URLs scheinen jedoch auch bei "normalen" Suchvorgängen zurückgegeben zu werden.Antworten:
Wenn ich Ihre Website so überprüfe, wie sie jetzt ist, bin ich mir nicht sicher, ob dies länger / aktuell ein Problem ist.
Das Problem ist keine interne Verknüpfung auf Ihrer Website unter Einbeziehung von UTM-Parametern (wie eine andere Frage nahelegt).
Es scheint eher so, als ob ein Prozess, den Sie zum Teilen Ihres Website-Inhalts in sozialen Medien durchführen müssen, darin besteht, die UTM-Parameter in den URLs zu belassen und diese URLs zu teilen, was irgendwann dazu geführt hat, dass sie indiziert wurden.
Es ist selten, dass dies passiert, aber es ist schon vielen anderen Websites passiert. Die Tatsache, dass nur drei Seiten mit diesen Parametern indiziert sind, weist darauf hin, dass dies weder ein ernstes noch ein allgemeines Problem ist.
Hier sind die Schritte, die Sie unternehmen können, um dies zu verhindern: -
1. Geben Sie auf Ihren Seiten eine kanonische URL an
Sie tun dies bereits und die Implementierung ist korrekt. Dadurch wird sichergestellt, dass nur die angegebene kanonische URL in Suchmaschinen gewichtet wird. Vermutlich war dies immer der Fall, aber wenn nicht, könnte dies erklären, warum es einige alte Instanzen von Seiten gibt, die noch mit UTM-Parametern indiziert sind.
2. Weisen Sie Google an, die UTM-Parameter in der Suchkonsole nicht zu indizieren
Für den Fall, dass einige URLs mit den UTM-Parametern indiziert werden (wie in Ihrem Fall), sollte der URL-Parameter im Abschnitt "Crawlen> URL-Parameter" der Google Search Console für Ihre Domain als erkannt angezeigt werden (siehe unten).
Auch wenn die UTM-Parameter nicht angezeigt werden, können Sie sie mit 'Parameter hinzufügen' erstellen.
Wählen Sie einfach
No: Doesn't affect page content (ex: tracks usage)
(als "Passive Parameter" bezeichnet) und Google crawlt dann normalerweise nur eine URL mit einem bestimmten Parameterwert .3 Lassen Sie die URL-Parameter in Ihrer robots.txt nicht zu
Dadurch wird Google daran gehindert, den Inhalt dieser URLs zu indizieren, nicht jedoch die tatsächlichen URLs selbst (sie könnten weiterhin in den Suchergebnissen angezeigt werden, lassen jedoch die Beschreibung wie unten weg).
Einfach das Hinzufügen dieser so etwas wie die folgenden würde Griff aus
robots.txt
: -Fazit
Die Schritte 1 und 2 sollten ohnehin als Vorsichtsmaßnahme und "Best Practice" und Schritt 3 zusätzlich zu den Schritten 1 und 2 ausgeführt werden (da sie für sich genommen nicht wirksam sind).
In der Google Search Console besteht auch die Möglichkeit, URLs (vorübergehend) zu entfernen. Dies ist besonders nützlich, wenn einige hartnäckige Seiten noch indiziert sind, Sie jedoch wissen, dass die Hauptursache des Problems behoben wurde und diese Funktion ausreichen sollte, um sie ein für alle Mal aus den Suchergebnissen zu entfernen.
Ich habe dies nicht als obigen Schritt aufgenommen, da ich mich trotz vorheriger Recherche nicht erinnern kann, ob es URLs mit Parametern unterstützt [Zitieren erforderlich]. Ich wusste einmal die Antwort, aber mein Gedächtnis versagt mir bei dieser besonderen Gelegenheit.
Weitere Informationen zum Entfernen von URLs aus Google .
quelle
robots.txt
(# 3) , dann werden Sie nicht auch diese Kampagnen blockieren , werden verfolgt ? ... und auch verhindern, dass das kanonische Tag auf der Seite gelesen wird (# 1)?noindex: /*?utm=*
in robots.txt verwenden.Es scheint, dass Sie diese Links im Inhalt Ihrer Website verwenden, um Seiten miteinander zu verknüpfen.
Um sicherzustellen, dass Google nicht indiziert, können Sie
rel="nofollow"
diese Links auf Ihrer Website hinzufügen und diese Parameter aus der robots.txt-Datei blockieren:quelle
Haben Sie überprüft, ob Ihre kanonische URL indiziert wurde oder nicht? Wenn die kanonische URL indiziert wurde, besteht kein Grund zur Sorge.
Sie können die Webmaster-Tools von Google ausprobieren und hier ändern, wie Google mit URL-Parametern umgeht .
quelle