Gibt es eindeutige Anzeichen dafür, dass meine Sitemap-Datei von Vorteil ist?

73

Ich habe kürzlich eine sitemap.xml-Datei erstellt und in mein Google Webmasters Tools- Konto hochgeladen . Google hat keine Probleme oder Fehler mit der hochgeladenen Sitemap meiner Website gemeldet.

Jetzt ist meine Frage:

  • Woher weiß ich, ob meine Sitemap in den Google Webmaster-Tools funktioniert?

Der Grund, den ich frage, ist, dass ich nicht weiß, was ich sehen oder suchen soll, und dass ich das Gefühl habe, eine nutzlose Datei hochgeladen zu haben.

Stephen Ostermiller
quelle

Antworten:

93

Mithilfe einer Sitemap-Datei können Suchmaschinen neue und aktualisierte URLs auf Ihrer Website finden. Insbesondere wenn Ihre Website ziemlich groß ist, kann dies dazu beitragen, dass sie sich auf den neuen und aktualisierten Inhalt konzentrieren können, anstatt blind durch alles zu kriechen, um festzustellen, ob sich etwas geändert hat. Dies kann dazu führen, dass neue Inhalte viel schneller gefunden werden. Dies ist insbesondere dann bemerkenswert, wenn die Website größer oder komplexer ist.

Insbesondere bei Google (ich arbeite bei Google; ich weiß nicht, wie andere Suchmaschinen damit umgehen) geschieht Folgendes:

  • Finden Sie die Anzahl der indizierten URLs für Ihre Website: Diese Statistiken werden täglich neu berechnet und sind sehr genau. Sie finden diese auf der Detailseite für Sitemaps .
  • Entdecken Sie Probleme mit der Kanonisierung: Wenn die Zahlen dort nicht übereinstimmen , ist dies häufig ein Zeichen dafür, dass Sie in der Sitemap-Datei URLs angeben, die nicht mit den beim Crawlen gefundenen übereinstimmen. Das ist normalerweise ein Zeichen dafür, dass Sie an der Kanonisierung arbeiten müssen .
  • Hilfe bei der Kanonisierung: Wenn wir auf Ihrer Website mehrere URLs mit identischem Inhalt finden, geben wir jeder URL, die in einer Sitemap aufgeführt ist, einen zusätzlichen Vorteil, auch wenn Sie keine anderen Kanonisierungsmethoden verwenden.
  • Suchen nach schlecht indizierten Teilen Ihrer Website: Diese Anzahl wird pro Sitemap-Datei angegeben. Sie können also separate Sitemap-Dateien für logische Abschnitte Ihrer Website erstellen, um Bereiche zu ermitteln, in denen Google nicht so viel indiziert, wie Sie möchten.
  • Durchforstungsfehler priorisieren: Im Abschnitt Durchforstungsfehler werden URLs, die in Sitemaps-Dateien angegeben wurden, separat aufgelistet. Da Sie diese URLs speziell angegeben haben, gehen wir davon aus, dass Sie sie indizieren möchten und dass alle dort auftretenden Crawling-Fehler wichtig sind.

Darüber hinaus können Sie in Sitemaps-Dateien mehrere Erweiterungen verwenden (z. B. für Bilder, Videos, Nachrichten oder Internationalisierung). Diese Erweiterungen sind alle optional.

Bei den meisten Websites ist das sichtbarste Element von Sitemaps-Dateien, dass die Anzahl der indizierten URLs angezeigt wird. Es kann ungefähr einen Tag dauern, bis sie angezeigt werden. Wenn Sie also zum ersten Mal eine Sitemap eingereicht haben, müssen Sie möglicherweise etwas Geduld mitbringen. Während andere Methoden (z. B. site: -query) sehr, sehr grobe Näherungswerte darstellen, ist diese Anzahl äußerst genau.

Bearbeitet, um hinzuzufügen: Eine andere Sache, die ich persönlich in Bezug auf Sitemaps sehr nützlich finde, ist, dass Sie, wenn Sie sie nicht direkt mit Ihrem CMS generieren, ausnahmslos viel darüber herausfinden, wie Ihre Website gecrawlt werden kann und welche Art von URLs entdeckt werden während dieses Prozesses. Ich habe viele Fälle erlebt, in denen das Crawlen einer Website mit einem Tool auf Ihrer Seite (z. B. einem Sitemaps-Generator) Probleme aufwirft, die Sie möglicherweise übersehen, z. B. Sitzungs-IDs in URLs, Duplizieren von Inhalten durch URL-Unterschiede, unendliche Leerzeichen (z als endlose Kalender) oder sogar Teile einer Site, die überhaupt nicht verlinkt sind.

John Mueller
quelle
Tolle Infos. Ich habe auch gehört, dass es bei stark frequentierten Websites besser ist, keine Sitemap zu verwenden, da Google das Crawlen besser macht und die Indizierung möglicherweise aufhört, wenn in Ihrer Sitemap etwas fehlt.
Chris_O
3
@ Chris_O Du bringst verschiedene Probleme zusammen. In diesem Beispiel ist es nicht so, dass Google von sich aus einen "besseren" Job macht. Die Sitemap selbst ist fehlerhaft. Dies ist kein direktes Argument dafür, "überhaupt keine Sitemap zu verwenden". Die Lösung für diese Situation besteht darin, die Sitemap zu reparieren. Darüber hinaus sind Sitemaps informativ und keine Direktiven. Etwas, das in einer Sitemap fehlt, bedeutet nicht, dass Google es nicht selbst findet oder ignoriert.
,
Die fragliche Site hat über 40.000 indizierte Seiten und neue Inhalte werden in weniger als 5 Minuten indiziert (ohne Sitemap). Basierend auf Ihrer Antwort werden wir mit dem Bau beginnen und sie in Jahre aufteilen.
Chris_O
@ John-Müller Hallo Herr. m. - Ich habe einmal eine Test-Sitemap mit 1000 URLs eingereicht, wir haben eine Indexzahl von ungefähr 700 zurückbekommen, jetzt haben wir alle 1000 URLs über die Website getestet: www.complete.org/url/to/the/page.html, wir sind zurückgekommen eine Zählung weit unter den 700 URLs (mehr in der Region 200). was bedeutet das?
Franz
2
@Franz Es gibt manchmal Details, die es schwierig machen, die Anzahl der indizierten URLs mit site: -queries zu reproduzieren. Es gibt zum Beispiel Situationen, in denen wir mehrere URLs kombinieren und nur eine davon für eine Site anzeigen: -query. Wenn Sie dort also einen Unterschied feststellen, lohnt es sich normalerweise nicht, sich Sorgen zu machen.
John Mueller
6

Wenn Sie keine Fehler erhalten, können Sie davon ausgehen, dass Google sie analysiert hat und den Inhalt kennt. Dies bedeutet jedoch nicht, dass sie diese Seiten crawlen und / oder indizieren. Sitemaps sind nur eine weitere Möglichkeit, Suchmaschinen über Ihre Seiten zu informieren. Sie sind nicht verpflichtet, einige oder alle dieser Seiten zu crawlen und zu indizieren. Gleiches gilt für das Auffinden von Seiten über Links oder URL-Einreichungen.

John Conde
quelle
1
Als zusätzliche Information ist es ziemlich einfach zu sehen, ob Google die Sitemap versteht. Überprüfen Sie unter Optimierungen -> Sitemaps. Hier erfahren Sie, wie viele URLs in der Sitemap eingereicht wurden. Die Sitemap hat den Inhalt erfolgreich gelesen und so viele Links darin gefunden. Die zweite Zahl ist, wie viele indexiert wurden, und wie John betont, liegt es ganz bei Google, ob sie keinen, einige oder den größten Teil Ihres Contents als sinnvoll erachten. Es wird immer weniger als der eingereichte Betrag sein, Google findet nur einige Seiten nicht so heiß und kümmert sich nicht darum.
Fiasko Labs
1

Google crawlt Ihre Website normalerweise gut, wenn Sie über eine gute Anzahl hochwertiger Links verfügen. Wenn Sie viel Zeit damit verbringen, sich die Anzahl der von Ihnen indizierten Seiten anzusehen, ist es empfehlenswert, Ihre Website zu verbessern und einige hochwertige Links zu erhalten.

David Urmann
quelle
0

Vielleicht ein Sitemap-Validierungs-Tool wie dieses , obwohl ich noch nie "nicht" gesehen habe, wie die Sitemap in Gang gekommen ist.


quelle
Die Datei wurde bereits validiert. Das ist nicht die Frage.
,
0

Für größere Websites, zum Beispiel Websites mit Hunderten, Tausenden oder Millionen von Seiten, ist dies sehr nützlich. Auf unserer Unternehmenswebsite mit 400.000 Seiten wurden URLs dynamisch erstellt, indem Inhalts-IDs und URL-Parameter mit & verwendet wurden. Die Google Webmaster-Tools geben Ihnen Feedback zu gecrawlten Seiten und zeigen Ihnen Fehler an. Sie können die Seite debuggen oder öffnen und Überzeugen Sie sich selbst, was los ist. Auf diese Weise hat Google uns geholfen, eine bessere Website zu erstellen, und uns ein paarmal vor großen Verlegenheiten bewahrt.

Es ist auch nützlich, die Anzahl der indizierten Seiten im Vergleich zur Anzahl der gecrawlten Seiten zu sehen.

Bei kleineren Websites ändert sich nichts an den Suchergebnissen, wenn es sich bei der Website um eine kleine Gruppe von .html-Seiten handelt, auf denen jede Seite über ein Menü verlinkt ist und die Website nicht häufig aktualisiert wird. Sie werden keinen Vorteil haben, wenn Sie eine Sitemap gegenüber jemandem hochladen, der keine Sitemap hochgeladen hat.

Ich hatte auch ungefähr 20 kleine Websites, auf denen Sitemaps automatisch von Cron-Skripten generiert wurden, und ich hörte damit auf. Eines Tages stellte ich fest, dass XML-Dateien aus Versehen etwa 6 Monate lang nicht korrekt generiert wurden. Google hat diesen Fehler jedoch dankenswerterweise ignoriert und diese Websites vollständig indexiert, auch wenn Sitemaps Fehler aufwiesen. Google verwendet die Sitemap lediglich als Hinweis, wohin sie gehen sollen, nicht sehr ernst.

Mike
quelle