Welche Auswirkungen haben Probleme mit doppelten Inhalten bei Drupal-Kommentaren?

7

Angenommen, wir haben einen Knoten namens node / 123 mit aktivierten Kommentaren. Wenn Kommentare abgegeben werden, werden zusätzliche URLs generiert / comment / 1, / comment / 2 ... und / comment / reply / 2/1 usw. Leider sind diese neuen URLs eine Seite, die eine vollständige Kopie des Inhalts in der enthält Originalseite / Knoten / 123 oder der Kommentar als Antwort. Die robots.txt von Core hat nurDisallow: /comment/reply/

Würde das Hinzufügen der folgenden Dateien zur robots.txt-Datei Auswirkungen haben? Wäre dies zu empfehlen (oder würde sogar ein Kernproblem veröffentlicht, das auf dieses Problem hinweist?)

# Paths (clean URLs)
Disallow: /comment/
Disallow: /comment*/
Disallow: /comment/reply/
Disallow: /comment/reply*/
...
# Paths (no clean URLs)
Disallow: /?q=comment/
Disallow: /?q=comment*/
Disallow: /?q=comment/reply/
Disallow: /?q=comment/reply*/
Nigel Waters
quelle
2
Es gibt hier eine ähnliche Diskussion: drupal.org/node/1680978 Schauen Sie sich auch dieses Sandbox-Modul an: Permalinks to Nodepath. drupal.org/sandbox/Ayesh/1578662
Gilzero
1
Ich würde dies tatsächlich woanders hinbringen, da dies ein allgemeines SEO-Problem ist und nur lose mit Drupal zusammenhängt.
Letharion
2
Ich habe anfangs überlegt, dies woanders hin zu bringen, aber dies ist ein spezifisches Problem für Drupal. Es braucht wahrscheinlich jemanden, der sich mit SEO auskennt und Drupal kennt.
Nigel Waters

Antworten:

5

Ich bin der Autor des Sandbox-Moduls ( Permalink to Nodepath ), das im ersten Kommentar zur Frage erwähnt wurde. Marios Antwort ist in Bezug auf kanonische URLs gut beschrieben - aber leider nicht die einzige Implikation .

Diese Kommentar- / * -URLs stammen von Drupal 7. In Drupal 6 hatten Kommentare keine eigenen URLs. Kanonische URLs können das Problem mit doppelten Inhalten lösen, was für die meisten IMO-Websites vollkommen in Ordnung ist. Spam-Kommentare können Ihrer Site-Fehlerliste jedoch nach Belieben 404- und 403-Fehler hinzufügen. Dies war meine persönliche Erfahrung, dass mein Spam-Suchdienst einige der Kommentare nicht löschen konnte, sodass ich sie manuell löschen musste. Aber Google hatte sie bereits indiziert.

Screenshot der Crawling-Fehler meines Blogs von Google Webmaster Central

Das eigentliche Problem ist, dass anonyme Benutzer jede Art von Kommentaren veröffentlichen können. Wenn sie gelöscht oder unveröffentlicht wurden, protokolliert Google (und andere Suchmaschinen) sie als Crawling-Fehler, was ziemlich ärgerlich ist und wahrscheinlich auch Ihren Seitenrang beeinflusst.

Andererseits respektieren die meisten Link-Sharing-Sites, einschließlich Facebook, die kanonische URL nicht. Zum Beispiel http://example.com/node/1können 56 (Facebook) Likes vorhanden sein, aber sie werden nicht synchronisiert, wenn der Benutzer dies mag http://example.com/comment/5(angenommen, Kommentar 5 ist ein Kommentar zu Knoten 1). Aus Facebook-Sicht sind es 2 verschiedene URLs (tatsächlich sind sie es), so wie die Anzahl unterschiedlich ist.

Module wie Boost basieren auch auf der tatsächlichen Anforderungs-URI-Einstellung von $ _SERVER, die noch vorhanden ist comment/5(obwohl die kanonische URL lautet node/5). Sie können jedoch die Konfiguration des Boost-Moduls ändern, um dies zu beheben.

Es ist sehr beliebt arg(1) , die Knoten-ID in benutzerdefinierten Blöcken, Modulen, Ansichten usw. abzurufen. Sie funktionieren , da diese Funktion in der Rückruffunktion von Kommentar- /% -URLs $_GET['q']auf die kanonische URL festgelegt wird. Diese $ _GET-Änderung löst die meisten Probleme in programmierbaren Dingen.

AyeshK
quelle
5

Nach der Untersuchung glaube ich nicht, dass es hier ein SEO-Problem gibt. Es ist sicher ein Ärger, aber es ist kein Problem und hier ist der Grund:

Gemäß den Empfehlungen von Google hier http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html für kanonische URLs und doppelte Inhalte haben Sie keine Probleme, wenn Sie nur dann doppelte Inhalte haben, wenn Sie Ihre ordnungsgemäß angeben kanonische URLs. Außerdem zeigt Google (und höchstwahrscheinlich alle anderen Suchmaschinen) nur die kanonische URL in den Suchergebnissen an und nicht die anderen URLs.

In Drupals Fall sind die kanonischen URLs richtig eingestellt. Zum Beispiel habe ich einen Testartikel (Knoten / 2) erstellt und Kommentare und Antworten hinzugefügt und die folgenden Seiten erhalten:

  • / node / 2
  • / comment / 2
  • / comment / 3

Nach der Überprüfung des generierten Quellcodes haben alle den gleichen <link rel="canonical" href="https://drupal.stackexchange.com/node/2" />Quellcode ordnungsgemäß erstellt. Grundsätzlich wird in den Suchergebnissen nur die Hauptartikelseite angezeigt.

Ob ich nun den Core so ändern soll, dass nur eine einzelne Seite generiert wird oder die robots.txt-Datei wie angegeben gepatcht wird, ist mir ein Rätsel. Ich bin mir sicher, dass vor der Implementierung eines der oben genannten Punkte viele Überlegungen und Sonderfälle zu berücksichtigen sind. Da es wirklich kein Problem gibt, ist es vielleicht am besten, die Dinge so zu belassen, wie sie sind.

Prost!

Hinweis: Ich verwende Drupal 7.17 (neueste Version ab heute).

Mario Awad
quelle
Ich denke das ist definitiv die richtige Antwort. node_page_view () legt die kanonische URL ( api.drupal.org/api/drupal/modules%21node%21node.module/function/… ) fest, sodass Sie sich keine Sorgen mehr machen müssen. Wenn Ihnen die Rückrufe / comment /% nicht gefallen, können Sie sie definitiv zu robots.txt hinzufügen oder über hook_menu_alter () ganz entfernen.
Charlie Schliesser
2
Ich möchte auch hinzufügen, dass Sie bereits eine URL wie example.com/node/123, / node / 123 / view / foo, / node / 123 / view / foo / bar / baz aufrufen können und alle die Einstellung 200 zurückgeben Die kanonische URL hilft in all diesen Fällen.
Charlie Schliesser
Ich habe das gleiche Problem, aber mein Problem ist, dass kanonische URLs aktiviert sind, aber NICHT auf meine Knotenseite zeigen. Stattdessen zeigen meine kanonischen URLs auf die Kommentar- / Wiedergabeseite. Wohin zum Bearbeiten, damit sie richtig zeigen?
blue928
Seltsam! Ich glaube nicht, dass es eine Administrationsseite gibt, auf der Sie diese bearbeiten können. Welche Drupal-Version verwenden Sie und welche Module haben Sie installiert?
Mario Awad