Crawlen Suchmaschinen eine Seite mit dem Metaattribut 'noindex'?
Der Grund, den ich frage, ist, dass wir nahezu doppelten Inhalt haben, der durch die facettierte Navigation verursacht wird, und die gefilterten Seiten "noindex" angegeben haben und ich mich gefragt habe, ob diese Seiten immer noch als doppelte Inhalte erkannt werden?
Muss ich dem Link ein 'nofollow'-Attribut hinzufügen, während wir diese Seiten einzigartig machen?
seo
web-crawlers
duplicate-content
noindex
nofollow
Trauben-Soda
quelle
quelle
Antworten:
Wie Goyllo bereits angegeben hat, crawlen Suchmaschinen-Bots Seiten mit einem
noindex
Meta-Tag. Wenn Sie darüber nachdenken, müssen sie die Seite crawlen, um dasnoindex
Meta-Tag überhaupt zu sehen . (Sie könntenX-Robots-Tag
stattdessen einen HTTP-Antwortheader verwenden, und theoretisch müsste ein Bot nur eine HEAD-Anforderung ausführen, um dasnoindex
Attribut anzuzeigen - aber so rollt Google nicht.)Wenn es sich um eine Seite handelt
noindex
, kann dies immer noch der Fall seinfollow
(was standardmäßig der Fall ist, sofern Sie dies nicht ausdrücklich angebennofollow
). Daher muss die Seite offensichtlich gecrawlt werden, um die folgenden Links zu ermitteln.Dadurch wird dieser bestimmte Link einfach vom Ranking-Algorithmus abgezogen. Dieser bestimmte Link wird also nicht als Ranking-Faktor für die Ziel-URL verwendet. Ich gehe davon aus, dass es höchstwahrscheinlich auch andere eingehende Links zu dieser Seite gibt.
Duplikat von was? Eine Seite kann nur dann als Duplikat betrachtet werden (in den Augen des Suchmaschinenindex), wenn sie indiziert ist. Wenn es nicht indiziert ist, kann es kein Duplikat sein.
Das "Problem" mit doppeltem Inhalt besteht darin, dass die Suchmaschine entscheiden muss, welche Seite in den SERPs zurückgegeben werden soll, wenn zwei (oder mehr) doppelte Seiten gecrawlt und indiziert wurden . Wenn Sie diesen doppelten Inhalt nicht selbst auflösen (Weiterleiten, kanonisches Tag oder einfach den Inhalt eindeutig machen), liegt dies außerhalb Ihrer Kontrolle - die Suchmaschine trifft die Entscheidung für Sie. Sie verwässern möglicherweise auch Ihr Suchranking, da Benutzer verschiedene Seiten entdecken und auf die eine oder andere Seite zurückgreifen.
Um zu verhindern, dass eine Seite gecrawlt wird (dh nicht einmal angefordert wird), können Sie einen Eintrag in Ihre
robots.txt
Datei aufnehmen. Dies bedeutet jedoch, dass die Suchmaschinen Ihrnoindex
Meta-Tag nicht sehen können . Dies sollte zwar verhindern, dass die Seite in normalen Suchergebnissen angezeigt wird, verhindert jedoch nicht unbedingt, dass die Seite in den SERPs (dh "indiziert") als Nur-Link-Ergebnis angezeigt wird, wenn sie mit verknüpft ist. Es kann jedoch immer noch nicht als "doppelt" betrachtet werden, da der Inhalt nicht gelesen und indiziert wurde .quelle
Ja, Google crawlt immer noch Webseiten mit noindex-Tag.
Wenn Sie jedoch denselben Inhalt auf zwei verschiedenen Webseiten haben und eine URL kein Index-Tag enthält, während dies bei der zweiten nicht der Fall ist, sollten Sie sich darüber keine Sorgen machen, da von allen doppelten Inhalten nur eine Webseite von Google indiziert wird. Die restlichen Webseiten können gecrawlt, aber nicht im Google-Suchergebnis indiziert werden. Das ist also in Ordnung.
quelle