Verwendung von rel = canonical mit Syndication

21

Ich arbeite auf einer Site, die die Syndikation von Inhalten ermöglicht (über APIs und Data Dumps). Wir stellen fest, dass eine Reihe von Websites, die unseren Inhalt erneut veröffentlichen, in den Google-Suchergebnissen höher erscheinen, obwohl wir der ursprüngliche Herausgeber sind. Das ist frustrierend.

Wir erwägen, einen rel=canonical Teil unserer Zuschreibungsanforderungen zu erfüllen. Google hält es für legitim , es domänenübergreifend und in Syndikationsszenarien zu verwenden.

Haben Sie dies getan und berücksichtigt Google die kanonische URL in Suchrankings? Wird es uns helfen, solche SERP "Spam" zu reduzieren?

Matt Sherman
quelle
1
Was Sie beschreiben, ist kein Spam. Es sind Menschen, die das tun, was Sie von ihnen verlangen - Ihre Inhalte zu syndizieren. Spam ist unerwünschte E-Mail-Werbung und Webseiten, die ausschließlich zum Zweck erstellt wurden, Menschen mit Werbung zu bombardieren, anstatt etwas Wertvolles zu schaffen. Wenn dies die Art von Websites sind, auf denen Ihre Inhalte syndiziert werden, müssen Sie Ihr Syndication-Modell überdenken. Andernfalls wird Ihre Website schlecht dargestellt (nur durch Verknüpfung). Ein besseres Suchranking als Sie zu haben, führt jedoch nicht zu Spam auf der Website.
Lèse majesté
@Lèse wirklich? diese Seiten scheinen in direktem Widerspruch zu dem „wenig oder gar keinem ursprünglichen Inhalt“ -Regel von Google selbst festgelegt werden google.com/support/webmasters/bin/answer.py?answer=66361
Jeff Atwood
@ Jeff: Auf welche Sites verweisen Sie konkret? Ich spreche über die Verwendung von Web-Syndication selbst, was viele legitime Websites tun. Eine Spam-Site muss keinen syndizierten Inhalt verwenden, und die einfache Verwendung von syndiziertem Inhalt macht eine Site nicht zu einer Spam-Site (auch wenn sie ein besseres Ranking als Sie erzielt). In vielen wichtigen Nachrichtenmagazinen werden syndizierte Inhalte von AP verwendet, um die eigenen Inhalte zu ergänzen. Ist es doppelter Inhalt? Ja. Aber ist es Spam? Nein. Und ich glaube auch nicht, dass AP Spam fördert.
Majestätsbeleidigung
@ Lèse Stichwörter ergänzen hier ihren eigenen Inhalt . Wenn der gesamte Inhalt kopiert wird, wird genau was von Wert oder Interesse erstellt?
Jeff Atwood
1
@ Jeff: Aus Matts Frage geht nicht klar hervor, dass dies die Sites sind, auf die er sich bezieht. Er gab lediglich an, dass es Websites gibt, die seinen Inhalt erneut veröffentlichen (was der Zweck der Bereitstellung einer Syndication-API ist), die einen höheren Rang als der ursprüngliche Inhalt haben. Das bedeutet für mich nicht, dass dies (notwendigerweise) Spam-Sites sind. Aber vielleicht ist meine Interpretation der Frage falsch.
Lèse Majesté

Antworten:

10

Jeff ist in allem, was er sagte, zu 100% korrekt.

Ein weiteres Problem beim Anfordern der Verwendung einer Syndication-Website <link rel="canonical" href="http://example.com/foo">ist, dass Google darauf hingewiesen wird, dass die Syndication-Seite keinen Page Rank und http://example.com/foostattdessen den gesamten Page Rank erhalten soll.

Das schafft zwei Hauptprobleme.

  1. Die Syndication-Seite wird bei Google-Suchen überhaupt nicht angezeigt, da sie keinen Seitenrang hat. Die Syndication-Site würde sich darüber nicht im Geringsten freuen. Es ist unwahrscheinlich, dass sie bereit sind, Änderungen vorzunehmen, wenn sie dies überhaupt könnten.
  2. Möglicherweise wirkt sich dies nicht so auf Ihre Website aus, wie Sie es möchten, da Sie effektiv keine Links von der Syndication-Website erhalten. Ich würde mich fragen, wie Google damit umgehen würde. Es ist wahr, dass sie Cross Site Rel = "kanonisch" zulassen, aber ich glaube, dass der Zweck darin besteht, die Site zu migrieren und mehrere Sites unter einem Host mit dem gleichen Inhalt zu haben, um eine Defacto-Seite im Vergleich zu einer Reihe von ähnlichen / gleichen Seiten zu haben.
Ben Hoffman
quelle
Das sind einige gute Punkte. Ich denke, Syndication ist ein Bereich, in dem es einen legitimen Grund für doppelte Inhalte gibt. In diesem Fall ist es besser, den doppelten Inhalt in Ruhe zu lassen und zu akzeptieren, dass dies Syndication ist. Natürlich sollte Google im Idealfall der Originalseite den Vorzug vor den Seiten der Syndication-Partner geben. Möglicherweise muss ein neues Tag erstellt werden, das zwischen rel="canonical"dem HTML5- <cite>Tag und diesem liegt. Auf diese Weise können Suchmaschinen erkennen, welche Seite das Original für legitime doppelte Inhalte ist.
Majestätsbeleidigung
bestätigt, siehe meine Antwort von Matt Cutts unten.
Jeff Atwood
14

Meine Recherche ergab, dass das Verlangen eines Links zurück - und dass der Link NICHT befolgt werden darf - bei weitem das wichtigste Kriterium war.

Wenn die "Syndicating" -Seite den Inhalt nicht mit Links zum Original zurückordnet, die für Suchmaschinen gültig sind, haben Suchmaschinen eine viel schwierigere Zeit, den Ursprung des Inhalts zu verfolgen, und müssen komplexe "Find Duplicate Text" -Inhalte auf die Website anwenden das ganze Internet "Heuristik.

Ich bin mir nicht sicher, ob mehr nötig ist.

Verwandtes Matt Cutts Video

http://www.youtube.com/watch?v=x8XdFb6LGtM

Matt sagte, dass es eine gute Idee wäre, rel = "canonical" zu verwenden, um auf die Seite zurückzukehren, auf der der Artikel entstanden ist - so wie er oft vorgeschlagen hat, dass syndizierte Artikel konventionelle Links (dh ein <a>Nchor-Tag) enthalten, die auf den Link verweisen originaler Artikel.

Denken Sie daran, dass Canonical nicht nur rel="canonical"auf ein <a>Etikett klopft. es ist eher so:

<html>
    <head>
         <link rel="canonical" href="http://example.com/foo">
    </head>
...

Damit es eine andere Art von Arbeit erfordert, müssen Sie jeden Seitenkopf ändern. Ich bin mir nicht sicher, ob viele dieser "Syndikatoren" diese Kontrolle haben werden, im Gegensatz zu einem einfachen Link ( ohne Folgen!) Zurück zur Quelle.

Jeff Atwood
quelle
Ich würde auch empfehlen, Jeffs Blogeintrag zu diesem Thema zu lesen: „Defending Attribution Required“ - blog.stackoverflow.com/2010/08/defending-attribution-required
Scott Mitchell,
@ Scott beachten Sie, dass wir haben nicht eine gefolgt Verbindung ursprünglich erfordern, aber wir geändert , dass , weil die Google-Spider Material fehlte , dass die Verwendung Dump einige der Schaber in unseren Daten war ... und eine fehlende Verbindung , die nofollowed wird nicht nicht helfen steckte es wieder im Google-Index!
Jeff Atwood
@ Jeff: Eine Sache, die mich etwas nervt, ist, dass Links in einer Stackoverflow-Antwort rel = "nofollow" haben. Sollten Benutzer mit einem bestimmten Repräsentanten nicht den Vorteil eines rel = "nofollow" für die Links erhalten, die sie posten?
Scott Mitchell
Wenn Sie das Website-Feld in Ihrem Profil auf einer Stack Exchange-Website markieren, wird das folgende Feld aus Höflichkeitsgründen bei 2 KByte entfernt.
Jeff Atwood
1
@ Jeff, ich spreche über die Links in einer Stackoverflow-Antwort. Wenn ich zum Beispiel eine Ansicht / Quelle auf genau dieser Seite mache, sehe ich, dass die Links in deiner Antwort (wie die auf YouTube) rel = "nofollow" haben. Ich gehe davon aus, dass dies dazu dient, Spammer davon abzubringen, aber gleichzeitig scheint Ihnen eine Gelegenheit entgangen zu sein, die Relevanz von Suchergebnissen für andere zu verbessern, ganz zu schweigen davon, dass Sie der Person, die die E-Mail geschrieben hat, (in den Augen von Google) keinen Kredit geben Artikel / Blogeintrag / etc. das wird verbunden mit.
Scott Mitchell
2

Hinzufügen einer weiteren Antwort, da ich eine definitive Antwort von Matt Cutts dazu erhalten habe:

rel=canonicalfunktioniert zwar domänenübergreifend, verhält sich aber im Grunde wie eine 301-Weiterleitung , sodass die Seiten der Zielwebsite direkt auf Ihre Website in Google geleitet werden. Jede Website, die Ihren Inhalt verwendet, wird grundsätzlich aus den Suchmaschinen gelöscht.

Wie Matt sagt, ist die beste Art, rel=canonicalsich eine permanente 301-Weiterleitung vorzustellen .

Wenn Sie domänenübergreifende rel=canonicalAttribute als Attributionsbegriffe benötigen, werden Sie aufgefordert, diese an Sie weiterzuleiten. Autsch. : P

Wenn Sie dies wissen, ist dies eindeutig rel=canonicalnur für die Verwendung auf Websites gedacht, über die Sie selbst die Kontrolle haben - beispielsweise beim Verschieben von Domains und wenn Sie den Inhalt einer Domain als Ersatz für die andere benötigen.

Jeff Atwood
quelle