Wie verhindere ich, dass meine XML-Sitemap-Dateien in Google-Suchergebnissen angezeigt werden, beispielsweise als Ergebnis einer site:
Suchabfrage:
Ich verstehe nicht, warum Google zunächst Sitemap-Dateien in den Suchergebnissen anzeigt. Diese Dateien sind nicht für den menschlichen Verzehr bestimmt.
Google muss es crawlen können, damit es verarbeitet werden kann. Daher kann ich es in robots.txt nicht verbieten . Ich möchte nur nicht, dass sie es in die Suchergebnisse aufnehmen, nachdem sie es verarbeitet haben.
google
sitemap
search-engine-indexing
googlebot
xml-sitemap
Stephen Ostermiller
quelle
quelle
/sitemap.xml
in robots.txt aufgelistet und diese verlinkt dann auf einen anderen Satz von anderen Sitemaps wie/sitemap-123.xml
und/sitemap-124.xml
. Ich regeneriere die Sitemaps jeden Tag und die Zahlen ändern sich täglich. Die indizierte ist ziemlich alt. Ich verlinke nicht irgendwo auf meiner Site, aber es ist möglich, dass eine andere Site irgendwo einen Link dazu hat./sitemap.xml
anzunehmen, dass diese bestimmte Sitemap nun aus dem Index herausfällt. Ich möchte verhindern, dass Google sie auch in Zukunft für Suchanwender anzeigt.Antworten:
Google indiziert XML-Sitemaps (wie jede XML-Datei). Wenn Google eine URL kennt und eine gültige Antwort zurückgibt, besteht es die Einschlussregeln von Google und kann indiziert werden. Persönlich reiche ich die Sitemap nur über GWT ein und füge einen
Sitemap:
Verweis in robots.txt ein. Dies ist mit Sicherheit ausreichend, um sie zu indizieren.Die empfohlene Methode, um zu verhindern, dass diese Dateien von Google indiziert werden, besteht darin,
X-Robots-Tag
beim Bereitstellen der XML-Sitemap einen HTTP-Antwortheader einzuschließen. Beispielsweise:Genau wie das Einbinden eines Robots-META-Tags in HTML-Dateien kann der
X-Robots-Tag
Header für jeden Dateityp verwendet werden.Hinweis: Dieses Dokument (ab November 2008!) Scheint unseren eigenen John Mueller (Google) in Bezug auf die Verwendung der
X-Robots-Tag
Antwort beim Umgang mit XML-Sitemaps zu zitieren .Ja, Google indiziert und bewertet Ihre XML-Sitemap-Datei
Weitere Informationen finden Sie im Entwicklerhandbuch von Google:
Spezifikationen für Robots-Metatags und X-Robots-Tag-HTTP-Header
quelle
X-Robots-Tag: noindex
Header-Code schreiben ? Innensitemap.xml
oderrobots.txt
?header('X-Robots-Tag: noindex',true)
) oder, wenn Sie Apache verwenden, in Ihrer .htaccess-Datei oder in Ihrer Serverkonfiguration festlegen. Siehe Stephens Antwort für einen Beispielcode. Siehe auch den oben verlinkten Google-Entwicklerleitfaden.Die Antwort von MrWhite zur Verwendung von X-Robots-Tag scheint der richtige Weg zu sein.
Hier ist Code, der in .htaccess- oder Apache- Konfigurationsdateien verwendet werden kann. (Referenz: WebmasterWorld - Sitemaps, die in SERP angezeigt werden - Wie kann dies verhindert werden? )
Unter Nginx die Konfiguration wie folgt. (Referenz: Yoast X-Robots-Tag Beispiele )
quelle
Warum spielt es eine Rolle?
Wenn Sie Ihre Sitemap tatsächlich in SERP finden, haben Sie größere Probleme.
Ich würde mich eher darauf konzentrieren, Seiten mit nützlichen Inhalten aufzubauen. Auf diese Weise fällt es Ihnen sehr schwer, Ihre Sitemap zu finden. Nicht, dass es dich an diesem Punkt interessieren würde.
PS
Ziemlich jeder hält Sitemaps am selben Ort. Also, wenn jemand herausfinden wollte, wo Sie es aufbewahren, wird er es tun :)
quelle
Gib folgendes in die robots.txt ein
Senden Sie Ihre Sitemap stattdessen über die Google Webmaster-Tools.
quelle