Mithilfe einer Sitemap-Datei können Suchmaschinen neue und aktualisierte URLs auf Ihrer Website finden. Insbesondere wenn Ihre Website ziemlich groß ist, kann dies dazu beitragen, dass sie sich auf den neuen und aktualisierten Inhalt konzentrieren können, anstatt blind durch alles zu kriechen, um festzustellen, ob sich etwas geändert hat. Dies kann dazu führen, dass neue Inhalte viel schneller gefunden werden. Dies ist insbesondere dann bemerkenswert, wenn die Website größer oder komplexer ist.
Insbesondere bei Google (ich arbeite bei Google; ich weiß nicht, wie andere Suchmaschinen damit umgehen) geschieht Folgendes:
- Finden Sie die Anzahl der indizierten URLs für Ihre Website: Diese Statistiken werden täglich neu berechnet und sind sehr genau. Sie finden diese auf der Detailseite für Sitemaps .
- Entdecken Sie Probleme mit der Kanonisierung: Wenn die Zahlen dort nicht übereinstimmen , ist dies häufig ein Zeichen dafür, dass Sie in der Sitemap-Datei URLs angeben, die nicht mit den beim Crawlen gefundenen übereinstimmen. Das ist normalerweise ein Zeichen dafür, dass Sie an der Kanonisierung arbeiten müssen .
- Hilfe bei der Kanonisierung: Wenn wir auf Ihrer Website mehrere URLs mit identischem Inhalt finden, geben wir jeder URL, die in einer Sitemap aufgeführt ist, einen zusätzlichen Vorteil, auch wenn Sie keine anderen Kanonisierungsmethoden verwenden.
- Suchen nach schlecht indizierten Teilen Ihrer Website: Diese Anzahl wird pro Sitemap-Datei angegeben. Sie können also separate Sitemap-Dateien für logische Abschnitte Ihrer Website erstellen, um Bereiche zu ermitteln, in denen Google nicht so viel indiziert, wie Sie möchten.
- Durchforstungsfehler priorisieren: Im Abschnitt Durchforstungsfehler werden URLs, die in Sitemaps-Dateien angegeben wurden, separat aufgelistet. Da Sie diese URLs speziell angegeben haben, gehen wir davon aus, dass Sie sie indizieren möchten und dass alle dort auftretenden Crawling-Fehler wichtig sind.
Darüber hinaus können Sie in Sitemaps-Dateien mehrere Erweiterungen verwenden (z. B. für Bilder, Videos, Nachrichten oder Internationalisierung). Diese Erweiterungen sind alle optional.
Bei den meisten Websites ist das sichtbarste Element von Sitemaps-Dateien, dass die Anzahl der indizierten URLs angezeigt wird. Es kann ungefähr einen Tag dauern, bis sie angezeigt werden. Wenn Sie also zum ersten Mal eine Sitemap eingereicht haben, müssen Sie möglicherweise etwas Geduld mitbringen. Während andere Methoden (z. B. site: -query) sehr, sehr grobe Näherungswerte darstellen, ist diese Anzahl äußerst genau.
Bearbeitet, um hinzuzufügen: Eine andere Sache, die ich persönlich in Bezug auf Sitemaps sehr nützlich finde, ist, dass Sie, wenn Sie sie nicht direkt mit Ihrem CMS generieren, ausnahmslos viel darüber herausfinden, wie Ihre Website gecrawlt werden kann und welche Art von URLs entdeckt werden während dieses Prozesses. Ich habe viele Fälle erlebt, in denen das Crawlen einer Website mit einem Tool auf Ihrer Seite (z. B. einem Sitemaps-Generator) Probleme aufwirft, die Sie möglicherweise übersehen, z. B. Sitzungs-IDs in URLs, Duplizieren von Inhalten durch URL-Unterschiede, unendliche Leerzeichen (z als endlose Kalender) oder sogar Teile einer Site, die überhaupt nicht verlinkt sind.
Wenn Sie keine Fehler erhalten, können Sie davon ausgehen, dass Google sie analysiert hat und den Inhalt kennt. Dies bedeutet jedoch nicht, dass sie diese Seiten crawlen und / oder indizieren. Sitemaps sind nur eine weitere Möglichkeit, Suchmaschinen über Ihre Seiten zu informieren. Sie sind nicht verpflichtet, einige oder alle dieser Seiten zu crawlen und zu indizieren. Gleiches gilt für das Auffinden von Seiten über Links oder URL-Einreichungen.
quelle
Google crawlt Ihre Website normalerweise gut, wenn Sie über eine gute Anzahl hochwertiger Links verfügen. Wenn Sie viel Zeit damit verbringen, sich die Anzahl der von Ihnen indizierten Seiten anzusehen, ist es empfehlenswert, Ihre Website zu verbessern und einige hochwertige Links zu erhalten.
quelle
Vielleicht ein Sitemap-Validierungs-Tool wie dieses , obwohl ich noch nie "nicht" gesehen habe, wie die Sitemap in Gang gekommen ist.
quelle
Für größere Websites, zum Beispiel Websites mit Hunderten, Tausenden oder Millionen von Seiten, ist dies sehr nützlich. Auf unserer Unternehmenswebsite mit 400.000 Seiten wurden URLs dynamisch erstellt, indem Inhalts-IDs und URL-Parameter mit & verwendet wurden. Die Google Webmaster-Tools geben Ihnen Feedback zu gecrawlten Seiten und zeigen Ihnen Fehler an. Sie können die Seite debuggen oder öffnen und Überzeugen Sie sich selbst, was los ist. Auf diese Weise hat Google uns geholfen, eine bessere Website zu erstellen, und uns ein paarmal vor großen Verlegenheiten bewahrt.
Es ist auch nützlich, die Anzahl der indizierten Seiten im Vergleich zur Anzahl der gecrawlten Seiten zu sehen.
Bei kleineren Websites ändert sich nichts an den Suchergebnissen, wenn es sich bei der Website um eine kleine Gruppe von .html-Seiten handelt, auf denen jede Seite über ein Menü verlinkt ist und die Website nicht häufig aktualisiert wird. Sie werden keinen Vorteil haben, wenn Sie eine Sitemap gegenüber jemandem hochladen, der keine Sitemap hochgeladen hat.
Ich hatte auch ungefähr 20 kleine Websites, auf denen Sitemaps automatisch von Cron-Skripten generiert wurden, und ich hörte damit auf. Eines Tages stellte ich fest, dass XML-Dateien aus Versehen etwa 6 Monate lang nicht korrekt generiert wurden. Google hat diesen Fehler jedoch dankenswerterweise ignoriert und diese Websites vollständig indexiert, auch wenn Sitemaps Fehler aufwiesen. Google verwendet die Sitemap lediglich als Hinweis, wohin sie gehen sollen, nicht sehr ernst.
quelle