Ich habe eine Sitemap, die täglich mit vielen Links zu Produktseiten erstellt wird. Diese Produkte werden täglich aus einer anderen Datenquelle importiert. Da das Update darin besteht, alle aktuellen Produktinformationen wegzuwerfen und durch die neuen importierten Informationen zu ersetzen, springt das Datum der letzten Änderung immer um einen Tag. Dies wird auch in der Sitemap verwendet. Auch für Produkte, die sich nicht verändert haben. Alle Produktseiten geben vor, aktualisiert worden zu sein.
Wird Google die Website dafür bestrafen, dass sich die Seiten von Tag zu Tag geändert haben, obwohl dies nicht der Fall ist?
Meine Lösung wäre, den Eintrag nur zu ändern, wenn die neu importierten Produktdaten von den vorherigen Daten abweichen. Ich möchte nur sicherstellen, dass dies ein nützliches Upgrade ist, während ich meine Zeit auch für andere Verbesserungen verwenden kann.
quelle
Ich habe die Idee,
<lastmod>
jeden Tag zu aktualisieren, nie gemocht , da es nicht nur falsch ist, sondern irreführende Suchmaschinen.In einem Beitrag über SO schrieb Gary Illyes von Google:
Ich habe mich allgemein dafür
<lastmod>
ausgesprochen, entweder richtig oder gar nicht zu verwenden. Wenn Sie es (und<changefreq>
&<priority>
) weglassen, wird die Datei selbst sogar kleiner und für Suchmaschinen schneller lesbar.quelle
Nein. Google verwendet dies
lastmod
als Hinweis (wie alle Sitemap-Werte). Wenn es jedoch feststellt, dass Ihre Inhalte nicht täglich aktualisiert werden, wird es einfach ignoriert und Ihre Seiten nach eigenem Zeitplan erneut aufgerufen.quelle
Ich arbeite nicht für Google und kann nicht genau sagen, was sie tatsächlich tun, aber die sinnvolle Möglichkeit für sie,
<lastmod>
Zeitstempel zu behandeln, besteht darin, keine Zeit damit zu verschwenden, Seiten neu zu crawlen, die sich nicht geändert haben.Wenn Sie also alle Ihre Seiten jeden Tag als geändert melden, durchsucht Googlebot weiterhin alle Ihre Seiten in der gewünschten Reihenfolge, anstatt sich nur auf die geänderten Seiten zu konzentrieren. Tatsächlich ist es so, als hätten Sie überhaupt keine Zeitstempel für die letzte Änderung gemeldet.
Der Hauptgrund für die Angabe korrekter
<lastmod>
Zeitstempel besteht darin, dass Änderungen an Ihrer Website schneller im Google-Index angezeigt werden. Wenn Ihre Website Hunderte von Seiten enthält, dauert es eine Weile, bis Google alle gecrawlt und Änderungen gefunden hat. Wenn Sie Googlebot jedoch mitteilen, welche Seiten sich in letzter Zeit geändert haben, können diese Seiten zuerst gecrawlt werden, und es wird vermieden, so viel Zeit für den Rest zu verschwenden.Natürlich können Sie stattdessen auch die Crawling-Rate von Googlebot in den Webmaster-Tools erhöhen und auf das Beste hoffen. Aber wirklich, es sollte nicht zu schwierig sein, Ihr Update-Skript dazu zu bringen, Zeitstempel beizubehalten. Ich gehe zum Beispiel davon aus, dass Sie gerade so etwas tun:
Wenn ja, ändern Sie es stattdessen einfach so:
quelle
Nein, die von Ihnen angegebenen Informationen werden einfach ignoriert, wenn sie falsch sind. In diesem Fall ermitteln Webcrawler selbst, wie oft sie Ihre Seiten crawlen sollen.
quelle
Google wird Sie dafür nicht bestrafen. Um eine Strafe zu bekommen, musst du wirklich einen schwarzen Hut auf Googles Arsch ziehen, also mach dir darüber keine Sorgen. Google wird früh genug herausfinden, ob sich Ihre Inhalte geändert haben (daran haben sie in den letzten Jahren gearbeitet), und die lastmod-Eigenschaft als Hinweis verwenden.
quelle
Ich empfehle Ihnen, diese Best Practices für XML-Sitemaps und RSS / Atom-Feeds zu lesen
quelle