Kann ich in robots.txt die folgende relative URL für die Sitemap-Datei schreiben?
sitemap: /sitemap.ashx
Oder muss ich die vollständige (absolute) URL für die Sitemap-Datei verwenden, wie:
sitemap: http://subdomain.domain.com/sitemap.ashx
Warum ich mich frage:
- Ich besitze einen neuen Blog-Dienst, www.domain.com, mit dem Benutzer auf accountname.domain.com bloggen können.
- Ich verwende Platzhalter, daher verweisen alle Subdomains (Konten) auf: "blog.domain.com".
In blog.domain.com habe ich die robots.txt eingefügt, damit Suchmaschinen die Sitemap finden können. Aufgrund der Platzhalter verwenden alle Benutzerkonten dieselbe robots.txt-Datei. Deshalb kann ich die zweite Alternative nicht verwenden. Und im Moment kann ich URL Rewrite nicht für TXT-Dateien verwenden. (Ich denke, dass spätere Versionen von IIS damit umgehen können?)
quelle
robots.txt
ohne die Hauptstadt R benannt werden sollhttp
und verfügbar isthttps
, sollten Sie nur eine Sitemap (mit der kanonischen Variante) bereitstellen .Google-Crawler sind nicht intelligent genug, sie können keine relativen URLs crawlen. Daher wird immer empfohlen, absolute URLs zu verwenden, um die Crawlbarkeit und Indexierbarkeit zu verbessern.
Daher können Sie diese Variante nicht verwenden
Empfohlene Syntax ist
Hinweis:
quelle
Gute technische und logische Frage, mein lieber Freund. Nein, in der robots.txt-Datei können Sie nicht mit der relativen URL der Sitemap arbeiten. Sie müssen mit der vollständigen URL der Sitemap gehen.
Es ist besser, mit "Sitemap: https://www.example.com/sitemap_index.xml " zu gehen "
In der obigen URL gibt der Doppelpunkt Platz. Ich unterstütze auch gerne Deepak.
quelle