Bedeutung von Crawling-Fehlern

7

Meine Frage betrifft die Definition von Crawling-Fehlern in den Google Webmaster-Tools . Crawling-Fehler sind in wenige Abschnitte unterteilt.

Betrachten wir zunächst den HTTP- Abschnitt.

Ich gehe davon aus, dass alle defekten Links in diesem Abschnitt irgendwie vom Crawler gefunden wurden. Dies sind nicht die Links von Sitemap. Wenn all diese Links gefunden wurden, indem Seiten von der Sitemap nach Links durchsucht wurden, warum wird nicht erwähnt, was die Quellseite war, wie im Sitemap-Abschnitt mit der Spalte Verknüpft von . Bitte korrigieren Sie mich, wenn ich falsch liege.

Sitemap- Bereich.

Sieht so aus, als ob all diese Links von meiner Sitemap stammen. Aber es gibt eine Spalte " Verknüpft von" , ich weiß bereits, dass all diese defekten Links von einer Sitemap stammen. Um den Fehler zu beheben, sollte ich meine Sitemap überarbeiten. Liege ich falsch?

Nicht befolgter Abschnitt.

Ich weiß nicht was es bedeutet. Es sieht so aus, als würden alle Links gesammelt, die eine Weiterleitung verursacht haben. Aus irgendeinem Grund betrachtet Google alle diese Weiterleitungen als falsche Weiterleitungen. Wissen Sie, ob es Regeln gibt, wie Sie eine falsche Umleitung ermitteln können? Eigentlich habe ich festgestellt, dass dies mein Fehler war. Ich habe versucht, die URL zu normalisieren und auf die richtige URL umzuleiten, aber ich habe die Normalisierung falsch durchgeführt.

Nicht gefundener Abschnitt.

Dieser Abschnitt ähnelt dem HTTP-Abschnitt, weist jedoch 404 Fehler auf. Dieser Abschnitt enthält die Spalte Verknüpft von . Aber sehr oft Linked Von ist nicht verfügbar . Was bedeutet es, Google kann mir nicht sagen, wie es diese nicht vorhandene Seite gefunden hat. Wie sich dieser Abschnitt auf den Sitemap-Abschnitt bezog. Enthält dieser Abschnitt auch alle 404 Links aus der Sitemap? Aber es gibt zu viele 404 Links, viel mehr als in der Sitemap. Ich habe versucht, einen Blick auf das zu werfen, was wir in Linked From haben , und ich habe gesehen, dass dieser Link vor zwei Monaten von Sitemap stammt. Aber warum Google es indiziert, der Link ist bereits tot, neue Sitemap hat es nicht. Gibt es ein Ablaufdatum für alte Links?

Nicht erreichbarer Abschnitt.

Sieht aus wie dieser Abschnitt für 500 Fehler. Dieser Abschnitt enthält keine Spalte " Verknüpft von" . Es gibt zu viele völlig bedeutungslose Links, ich weiß wirklich nicht, woher dieses Zeug kommt, und ohne Linked From kann ich nicht herausfinden, wie ich damit umgehen soll.

Entschuldigen Sie ein so großes Thema, aber ich möchte nur klarstellen, wofür jeder Abschnitt steht, denn es ist äußerst wichtig, um all diese Probleme zu lösen. Hoffentlich ist es nicht nur für mich nützlich.

Vielen Dank!

com
quelle
1
Ich habe mir die Hilfedatei für diese Berichte unter google.com/support/webmasters/bin/… angesehen und sie beantwortet die meisten Ihrer Fragen. Diejenigen, die es nicht beantwortet - gibt es ein Ablaufdatum? Ich glaube, niemand weiß, wie lange es dauert, bis Google schlechte Links aufgibt. Sie können in der Zwischenzeit eine Weiterleitung für diese Seiten vornehmen. Die bedeutungslosen Links - wir können nicht helfen, ohne mehr Informationen zu wissen.
Paulmorriss
Ich habe das gleiche Problem. 500 Fehler bei Links, die nicht von mir stammen und ungültige Parameter haben.

Antworten:

3

Ich denke, Sie haben mit Ihren Annahmen größtenteils Recht.

Der erste HTTP- Abschnitt zeigt alle 4xx-Fehler mit Ausnahme von 404-Fehlern (die weitaus häufiger auftreten, erhalten Sie also eine eigene Seite). Ich erhalte 400 (fehlerhafte Anfrage) Fehler von CodeIgniter, die bestimmte Zeichen in URLs nicht zulassen. 403 (verboten) sind auch hier.

Der Sitemap- Abschnitt informiert Sie nur über eine URL in einer Sitemap, die nicht gefunden werden kann. Der Abschnitt "Verknüpft von" ist nützlich, damit Sie Links zu dieser Seite entfernen können, wenn sie nicht mehr vorhanden ist.

Ich habe den nicht verfolgten Abschnitt noch nie gesehen, aber es hört sich so an, als würde er jede URL auflisten, die mit rel = ofollow verknüpft ist.

Nicht gefunden wird jeder 404-Fehler. Es werden wahrscheinlich Seiten in Ihrer Sitemap aufgelistet, da diese offensichtlich auf Ihrer Site verlinkt sein sollten (mit anderen Worten, eine Seite, die nur in der Sitemap enthalten und nirgendwo verlinkt ist, wird hier nicht angezeigt).

Nicht erreichbar sind 5xx Fehler, wie Sie sagten, die Serverfehler sind. "Verknüpft von" wird hier nicht angezeigt, da dies keine Rolle spielt. Keine Seite sollte jemals einen 5xx-Fehler zurückgeben.

DisgruntledGoat
quelle
Ich bin damit einverstanden, dass Seiten im Idealfall keine 5xx-Fehler zurückgeben sollten, aber manchmal ist das "Verknüpfen von" in diesem Zusammenhang nützlich (zumindest, um zu bestimmen, was Sie dagegen tun werden) - zum Beispiel, wenn Ihnen eine ungültige Abfrage gesendet wird Parameter aus einem Dropdown-Feld möchten Sie möglicherweise bestätigen, dass diese nicht von Ihrer Site stammen.
Zhaph - Ben Duguid
Ich bin mir nicht sicher, wie ich das besser erklären kann, aber es gibt kein "Ideal", 5xx-Fehler sollten niemals auftreten. Es ist ein Serverproblem, das nichts damit zu tun hat, wer auf Sie verlinkt oder welche Parameter sie senden.
DisgruntledGoat
Ich werde versuchen, mich dann besser zu erklären: Ein 5xx-Fehler kann durch schlechte Programmierung verursacht werden: Wenn ich erwarte, dass nur ein fester Satz von Variablen von meiner Seite gesendet wird, kann ich mich (dummerweise) nicht darum kümmern, die Situation zu behandeln, in der die Seite ist erhält die falschen Werte (dh diejenigen, die nicht in meiner Dropdown-Liste enthalten sind). Wenn ich weiß, dass eine zufällige Site versucht, auf eine Seite ohne die richtigen Werte zu verlinken, kann ich anrufen, wie / was zu beheben ist - und diese Korrektur könnte darin bestehen, eine 404 oder 403 zurückzugeben, oder ich könnte entscheiden, dass ich eine habe Dinge mit höherer Priorität, die behoben werden müssen, und dieser zweifelhafte Link können vorerst ignoriert werden.
Zhaph - Ben Duguid
Falsche Parameter würden zu PHP-Fehlern führen (wenn Sie PHP verwenden), die keine Serverfehler sind. Normalerweise gibt die Seite in diesen AFAIK-Fällen immer noch 200 (OK) zurück. Möglicherweise geben bestimmte Frameworks wie .net 500 Fehler aus, sollten dies aber nicht.
DisgruntledGoat
Ja, es war mehr .NET. Ich habe darüber nachgedacht, wo eine Ausnahme im Code zu einem internen Serverfehler führt. Ich würde mich nicht freuen, wenn dies zu einem "200-Erfolg" führen würde: "Antwortstatuscodes, die mit der Ziffer" 5 "beginnen, zeigen Fälle an, in denen dem Server bekannt ist, dass ein Fehler aufgetreten ist oder die Anforderung auf andere Weise nicht ausgeführt werden kann Der Server sollte eine [...] Erklärung der [...] Fehlersituation enthalten. [U] ser-Agenten sollten dem Benutzer alle enthaltenen Entitäten anzeigen. Diese Antwortcodes gelten für jede Anforderungsmethode. " bit.ly/t9zYJb
Zhaph - Ben Duguid