Nach meinen Recherchen werden alte Methoden zur Konsolidierung paginierter URLs in einer nicht mehr empfohlen.
Alte Wege:
Verwendenrel=prev/next
, aber:
"Rel = prev / next ist kein Indizierungssignal mehr" ( Google WebmasterBlog )
Verwendung noindex,follow
auf paginierten Seiten , aber:
"Wenn wir den Noindex dort länger sehen, als wir denken, dass diese Seite wirklich nicht für die Suche verwendet werden soll, werden wir ihn vollständig entfernen. Und dann werden wir den Links sowieso nicht folgen. Also, in Noindex und Follow ist im Wesentlichen so ähnlich wie ein Noindex, nofollow. " - John Mueller
Dies bedeutet, dass diese Seiten den PageRank nicht verteilen und möglicherweise sogar vom Crawlen ausgeschlossen werden, wodurch neue Links auf diesen Seiten nicht entdeckt werden.
Verwenden von rel = kanonisch zur ersten Seite , aber:
"Googlebot indiziert dann weder Seiten, die weiter entlang der Kette erscheinen, noch bestätigt es die Signale für den Inhalt, der von diesen Seiten verlinkt wird. " SearchEngineJournal
Das klingt nach dem noindex,nofollow
Problem, siehe oben.
Verwenden einer "Alle anzeigen" -Seite , aber:
Dies ist keine anwendbare Lösung für größere Seiten, bei denen aus Leistungsgründen beispielsweise Tausende von Links angezeigt werden müssten.
Es scheint also, dass die einzige Methode für große Ergebnismengen darin besteht, nichts zu tun, außer dem GoogleBot einige Hinweise zu geben, z
- Verwenden
rel=prev/next
, weil es nicht weh tut. - Verwenden Sie Standard-URL-Parameter wie
page=2
zur einfachen Erkennung. - Verwenden Sie Hinweise im Titel, um die Paginierung zu signalisieren, z
Shoes - Page 2
- Betet, dass alles gut geht.
Problem:
Wenn eine Domain 1000 Kategorien hat, von denen jede 20 Seiten hat, führt dies zu 20000 indizierten URLs anstelle von 1000, wenn wir die alten Methoden verwenden würden. Früher galt dies als schlecht.
Gibt es heutzutage einen Konsens darüber, wie es geht? Weil ich sehr leistungsfähige Domains gesehen habe, die diese neuen Entwicklungen nicht angepasst haben und an den alten Methoden festgehalten haben.
quelle
rel=prev/next
ist immer noch nützlich für die Zugänglichkeit und BrowsernavigationAntworten:
Ich würde in Betracht ziehen, die Paginierung vollständig zu entfernen:
Es gibt bessere Möglichkeiten, große Produktkataloge sowohl für Suchmaschinen als auch für Benutzer zu verwalten. Paginierung ist auf einer modernen Site nicht erforderlich.
Was sollten Sie tun, anstatt zu paginieren?
Wenn Sie Paginierung implementieren (und Sie werden es wahrscheinlich tun, weil es so einfach zu programmieren ist), würde ich vorschlagen:
/pages/
damit Sie sie verwenden könnenDisallow: /pages
. Durch die Paginierung wird der Link-Saft nicht effektiv weitergegeben, sodass die Rangfolge der Produktseiten nicht beeinträchtigt wird. Dadurch wird verhindert, dass neue tiefe Produktseiten entdeckt werden. Sie benötigen also unbedingt andere Links zu jeder Produktseite von anderen Produktseiten, bevor Sie dies tun.noindex
Option auf Seite 2+, um zu verhindern, dass Suchmaschinen Seiten mit geringer Qualität indizieren. Wenn Sie nicht verhindern können, dass die Seiten gecrawlt werden, verhindern Sie zumindest, dass sie indiziert werden.Wie Sie bereits bemerkt haben,
rel=prev/next
wird von Google nicht verwendet. Sie können es verwenden, wenn Sie möchten, aber es ändert nichts.rel=noindex,follow
Am Ende ist es dasselbe undrel=noindex,nofollow
für Google, weil Google keinen Link-Saft über Seiten weiterleitet, die nicht in seinem Index enthalten sind. Wie ich schon sagte, ist es sowieso nicht wirklich wichtig. Seite 3 hat fast keinen Link-Saft zum Weitergeben.rel=canonical
auf die erste Seite wird nicht mehr funktionieren. Heutzutage ignoriert Google das kanonische Signal, wenn der Inhalt nicht annähernd doppelt zu sein scheint. Da die aufgeführten Produkte unterschiedlich sind, ignoriert Google wahrscheinlich alle kanonischen Signale zwischen paginierten Seiten.Weitere Informationen zu Paginierung und PageRank
Google Pagerank (PR) wurde früher mit der Google Toolbar auf einer logarithmischen Skala von 0 bis 10 gemessen. Im Allgemeinen würde ich sagen, dass Sie den Toolbar PageRank (tPR) von 1 benötigen, um indiziert zu werden, und 2, um für wettbewerbsfähige Tail-Begriffe zu ranken. Um die Berechnung der PR zu vereinfachen, arbeite ich normalerweise in Linear Link Juice-Einheiten (LLJ).
Wenn ich sage, dass die Paginierung den PageRank nicht über Seite 2 hinaus überschreitet, gehe ich davon aus, dass jede Seite in der Paginierung nur auf die nächste Seite verweist. In diesem Fall ist es sehr leicht zu sehen, was passiert. Angenommen, Ihre Seite der Kategorie Seite 1 hat einen tPR von 3. Sie verfügt über 1.000 LLJ-Einheiten, von denen 900 (aufgrund des PageRank-Dämpfungsfaktors) bestanden werden können. Für den Fall, dass Ihre Seite 1 genau 21 Links enthält (20 zu Produkten und einer zu Seite 2), hat jede dieser anderen Seiten einen LLJ von 43 oder einen tPR von 1,6. Genug, um indiziert zu werden und einen anständigen Rang zu erreichen.
Seite 2 muss 43 LLJ bestehen. Jede Seite, auf die verlinkt wird, erhält nur 1,8 LLJ oder 0,3 tPR. Wahrscheinlich nicht genug, um die Produktseiten zu indizieren. Sicherlich nicht genug PageRank für Seite 3, um überhaupt etwas Sinnvolles weiterzugeben.
Wenn Sie auf jeder Seite 10 Paginierungslinks einführen, werden die Berechnungen viel schwieriger, da die Berechnung Rückkopplungsschleifen enthält. Sie müssen ein Verknüpfungsdiagramm erstellen und den Fluss in mehreren Iterationen berechnen. Sie geraten in eine ähnliche Situation. Sie haben 20 Produkte, die eine anständige Menge an PageRank von Seite 1 erhalten. Die Seiten 2 bis 11 der Paginierung erhalten ähnliche Mengen an PageRank, und Sie können möglicherweise die 200 Produkte erhalten, mit denen sie verknüpft sind. Jenseits von Seite 10 ähnelt es Seite 3 im Single-Link-Modell.
Am Ende ist die Berechnung der PR meist eine akademische Übung. Andere Faktoren wie das, was Google als minderwertig identifiziert, spielen letztendlich eine große Rolle. Google wird sich wahrscheinlich dafür entscheiden, Ihre paginierten Seiten nicht zu indizieren, da sie keine guten Zielseiten darstellen. Nach meiner Erfahrung behandelt Google nicht indizierte Seiten so, als hätten sie
noindex
Meta-Tags. Mit anderen Worten, selbst wenn Sie PR für sie erhalten können, spielt es keine Rolle, ob Google sie nicht indizieren möchte. Es wird nicht dazu führen, dass PageRank durch sie geleitet wird.quelle
Ich stimme dem zu, was @Stephen Ostermiller gesagt hat, aber ich muss leider nicht zustimmen, dass er Infinite Scroll implementiert.
Unendlich scrollen und mehr laden
Laut John Müller erweitert Googlebot die Höhe des Ansichtsfensters, um das Rendern der Seite so zu simulieren, als würde sie auf einer extrem langen Anzeige angezeigt. Wenn Ihre Seite mit unendlichem Bildlauf größer als das Ansichtsfenster ist, werden alle Links, die über die Grenze von Googlebot hinausgehen, niemals gecrawlt. Mit anderen Worten, Googlebot sieht die Seite mit dem unendlichen Bildlauf als eine lange Seite. Sie können auch eine lange Seite erstellen, um sicherzustellen, dass Googlebot sie crawlt.
Darüber hinaus erwähnte John Mueller, dass Googlebot nicht auf Javascript "mehr laden" -Schaltflächen "klickt".
Referenz - Google Webmaster-Hangout mit John Mueller: https://youtu.be/WAagTHeF9N0?t=1320
Weniger paginierte Seiten
Folglich denke ich, dass der einzige Weg, dies durchzugehen, darin besteht, paginierte Seiten mit so viel Inhalt wie möglich zu erstellen, um die Anzahl der paginierten Seiten zu verringern. Zum Beispiel habe ich die Anzahl der Beiträge, die ich auf meinen Kategorieseiten veröffentlicht habe, von 15 auf 60 erhöht. Mein Ziel war es, eine Seite mit einer übertragenen Dateigröße von 1 MB zu erhalten. Dazu habe ich meine JPG-Dateien optimiert. Mein WordPress-Thema ist sehr reaktionsschnell und zeigt winzige Bilder auf Mobiltelefonen an. Aus diesem Grund ist es wichtig, ein Bildkomprimierungstool wie https://squoosh.app/ zu verwenden (Squoosh ist ein kostenloses Online-Komprimierungstool, das von Google Chrome Labs verwaltet wird.)
Folglich muss Googlebot nur drei Seiten crawlen, um alle Links anzuzeigen. Ich hätte die Bilder auf der Kategorieseite entfernen können, um noch viele weitere Links auf dieser Kategorieseite hinzuzufügen.
Wenn Sie also 10 paginierte Seiten mit jeweils 10 Links haben und die Anzahl der Links auf 50 erhöhen, bedeutet dies, dass nur 2 paginierte Seiten generiert werden. Sie speichern 8 paginierte Seiten. Dies ist ein großer Vorteil in Bezug auf das Crawling-Budget. Dies bedeutet auch, dass es jedes Mal, wenn Sie der Kategorie einen Artikel hinzufügen, einige Zeit dauert, bis ein neuer Link den unteren Rand der Seite erreicht und zur zweiten Seite wechselt.
Meine Beobachtung:
Ich habe mehrmals in mein Zugriffsprotokoll geschaut. Ich habe eine von Wordpress betriebene Website mit paginierten Kategorieseiten. Normalerweise crawlt es häufig die erste Seite der Kategorieseite, dann selten die zweite Seite und noch seltener die dritte Seite. In meinem Fall wird die dritte Seite genauer gesagt alle 2 Monate gecrawlt. Je mehr Seiten Sie paginiert haben und je weniger wahrscheinlich Google die nachfolgenden Seiten crawlt.
Insofern behandelt Google paginierte Seiten sehr ähnlich wie normale Seiten, wenn sie tief in der Website-Struktur vergraben sind.
Ich habe mehrmals (prev / next) -Tags hinzugefügt und entfernt und bei Google oder Bing keine Änderungen festgestellt.
Außerdem habe ich dieses Foto eines Seminars mit John Mueller gefunden. Es gibt eine Folie mit dem Titel Paginierung ohne rel prev / next. Und es erinnerte mich daran, was John Mueller sagte.
Google wollte das Ranking dieser paginierten Seiten löschen, die Sie auf Clickbait-Websites in den Anzeigen unten auf einigen Websites sehen können.
Zum Beispiel: "Die 10 reichsten Männer der Welt". Der Webmaster teilte die Seite in 10 ein und zwang die Leser, auf "Weiter" zu klicken, um jeden reichen Mann zu entdecken. Sie tun dies, um die Leser zu zwingen, jede Werbung zu sehen. Diese Seite wird jedoch in Google niemals einen guten Rang haben, da die nachfolgenden paginierten Seiten (fast) keinen Google-Saft erhalten.
quelle