Ist es sinnvoll, eine 410 anstelle von 404 zurückzugeben, wenn eine Seite endgültig entfernt wurde?

16

Ist es sinnvoll, a zurückzugeben, 410anstatt 404wenn eine Seite endgültig entfernt wurde? In diesem Video sagt Matt Cutts, dass Google sie gleich behandelt, aber gibt es andere Gründe für die Implementierung einer 410(außer für die technische Korrektheit)?

großblind
quelle
Ich habe mich selbst darüber gewundert. Anscheinend wird 410 nirgendwo mehr verwendet.
Wogsland

Antworten:

7

Auf unserer Website haben wir kürzlich 410 Fehler für Seiten implementiert, die dauerhaft entfernt wurden. Wir haben rund 40 Millionen Seiten im Google-Index und werden mit 2 Millionen Anfragen pro Tag vom Googlebot gecrawlt.

Nach dem Bereinigen unserer Datenbank wurde eine große Anzahl von 404-Fehlern in den Crawling-Fehlern in den Webmaster-Tools festgestellt. Als wir auf 410 anstatt 404 umstellten, halbierte sich die Anzahl der Fehler pro Tag, während die Gesamtzahl der getätigten Anfragen ungefähr gleich blieb. Das ist also am Ende erfolgreicher gecrawlt Seiten pro Tag. Es sieht so aus, als würden Seiten mit dem Status 404 mehrmals gecrawlt, bevor sie vollständig aus dem Index entfernt werden.

Ich würde also sagen, es lohnt sich auf jeden Fall, 410 zu verwenden, um Ihr Google Crawl-Budget aufrechtzuerhalten.

stefan verhoeff
quelle
11

Es gibt mehr als Google auf dieser Welt. Ein 410 teilt einem Bot eindeutig mit, dass die Datei verschwunden ist. Ein 404 tut das nicht. Ein beständiger Bot versucht möglicherweise auf unbestimmte Zeit, einen 404 zu finden, während er möglicherweise sofort aufhört, nach einem 410 zu suchen, was Ihren Server sehr glücklich macht.

John Conde
quelle
2
Es geht jedoch in beide Richtungen: Ein wirklich beschissener Bot erkennt möglicherweise nur 200 und 404.
Peter Taylor
4
@ Peter ist sich nicht sicher, ob das wichtig ist - wenn sie beschissen sind und HTTP-Codes nicht verstehen, was würde das dann anrichten? Wenn Sie 404 verwenden, fordern sowohl beschissene als auch gute Bots die Seite weiterhin an, wohingegen bei 410 nur der beschissene die Seite anfordert.
DisgruntledGoat
1
Was @DisgruntledGoat gesagt hat. Siehe Postels Gesetz . Beschissene Implementierungen können einfach nicht berücksichtigt werden. Was wirst du tun, versuchen und für alle und jede ihrer besonderen Macken zur gleichen Zeit Rechenschaft ablegen? Es gibt seltene Ausnahmen, wie zum Beispiel die langjährige Browser-Dominanz von IE6, aber im Allgemeinen ist es einfach nicht die Mühe wert.
,
6

Abgesehen davon, dass es mehr Suchmaschinen als Google gibt, gibt es keinen Grund anzunehmen, dass Google die Art und Weise, wie 410 Antworten behandelt werden, niemals ändern wird. Anscheinend ist dies bereits geschehen: Die Informationen, die Matt Cutts im Video zitiert, stammen aus dem Jahr 2007, wohingegen dieser Beitrag von John Mu in den Webmaster Central-Foren von Google aus dem Jahr 2009 etwas anderes besagt:

"Ich habe die Sache 404 gegen 410 mit dem Team hier weiterverfolgt. Wie von einigen anderen hier und anderswo erwähnt, haben wir sie in der Vergangenheit im Allgemeinen gleich behandelt.

Nachdem wir uns jedoch angesehen haben, wie Webmaster sie in der Praxis verwenden, behandeln wir den 410-HTTP-Ergebniscode jetzt als etwas "dauerhafter" als einen 404. Wenn Sie also absolut sicher sind, dass eine Seite nicht mehr existiert und nie wieder existieren wird, ein 410 wäre wahrscheinlich eine gute Sache. "

Es sieht also so aus, als würde Google 410 Antworten in der Tat anders behandeln als 404.

Ilmari Karonen
quelle
4

Nach meiner Erfahrung versteht Google 410 Fehlercodes nicht.

Vor einiger Zeit habe ich eine vollständige Site geändert, sodass alle alten URLs "410 Gone" sind. Ich kann keine 301-Weiterleitungen verwenden, da keine direkte Beziehung zu einer neuen URL besteht.

Ich habe a verwendet .htaccess, um Google mitzuteilen, dass die alten URLs verschwunden sind, aber es wird mir immer wieder mitgeteilt, dass auf meiner Website eine GROSSE Menge von 404 Fehlern vorliegt. Ich habe die URLs im Crawl-Fehlerbericht überprüft und festgestellt, dass sie alle 410 und nicht 404 lauten.

user2623424
quelle
1

Es gibt mehr als Google auf dieser Welt.

Für die Wahrheit zitiert. Angesichts Ihrer Anforderung, Bots (und vermutlich auch Menschen) mitzuteilen, dass eine Seite dauerhaft entfernt wurde , würde ich mich für eine 301Weiterleitung zu einer Seite entscheiden, auf der (falls erforderlich) erläutert wird, warum der Inhalt entfernt wurde, oder den Bot / Benutzer übernehmen zurück zur Indexseite.

Die weniger bekannten HTTP-Fehlercodes werden in der Regel nicht so gut unterstützt, verstanden oder auf der ganzen Linie implementiert, daher halte ich mich im Allgemeinen an die, die für das erwartete und hoffentlich nahtlose Surferlebnis sorgen.

Die Wahl der richtigen Option hängt davon ab, wie viele Anfragen für den (jetzt) ​​fehlenden Inhalt noch eingehen.

stealthyninja
quelle
1
Warum bedeutet die Notwendigkeit, das Entfernen zu erklären, dass Sie mit dieser Erklärung zu einer anderen URL wechseln müssen? Die Erklärung könnte auf der Seite selbst mit dem Status 410 stehen, damit Suchmaschinen verstehen, dass es tot ist.
IMSoP