Wie erkennt Google das Veröffentlichungsdatum eines Beitrags?

17

Wenn ich etwas in Google suche, sehe ich manchmal das Veröffentlichungsdatum des Posts / Artikels darunter. Ich habe auch nach einem eigenen Artikel gesucht, den ich auf meiner von Wordpress betriebenen Website habe, und Google erkennt auch das Veröffentlichungsdatum.

Wenn ich die Quelle meiner Website öffne, werden keine speziellen Tags oder sonstigen Elemente angezeigt, die das Veröffentlichungsdatum angeben. Es ist nur in einem regulären div geschrieben, mit keinem speziellen Tag, der der SE mitteilt, dass es das Veröffentlichungsdatum ist (ich könnte auch andere Daten für andere Dinge auf der Seite haben).

Ist der genaue Ort des Wordpress-Veröffentlichungsdatums in der DOM-Struktur in Google fest codiert, oder fehlt mir etwas?

Ich erstelle eine neue Website mit meinem eigenen CMS und versuche herauszufinden, wie die Datumserkennung implementiert werden kann.

Can Poyrazoğlu
quelle
2
Ihnen fehlt sicherlich etwas: Sie haben sich nur den HTML-Code angesehen, aber es gibt auch HTTP-Header, die angeben, wann eine Seite geändert wurde. Was melden sie für den Permalink Ihres Artikels? Ich würde vermuten, dass Google dies in Kombination mit seinen eigenen Aufzeichnungen darüber verwendet, wie stark sich die Seite verändert hat, aber ich habe keine tatsächlichen Beweise - daher der Kommentar statt einer Antwort.
Peter Taylor
ja, ich war ein „grober“ try .. Ich werde schauen wird in Nicht-HTML - Elemente / Header und Sitemap , wie andere auch vorgeschlagen
Can Poyrazoğlu
@Peter Kein Zweifel, dass die HTTP-Header (insbesondere der zuletzt geänderte Header) eine Metrik sind, die von den SEs verwendet wird. Ich bezweifle jedoch, dass es eine große Rolle bei der Bestimmung des "Veröffentlichungsdatums" eines Artikels spielt - zumindest nicht, was Google als Veröffentlichungsdatum anzeigt. (Andere SEs scheinen kein 'Veröffentlichungsdatum' anzuzeigen?) Das Veröffentlichungsdatum eines Artikels ist wahrscheinlich nicht das letzte Änderungsdatum eines Dokuments. Die meisten Seiten auf dynamischen Websites (auch für WordPress-Posts) scheinen in der Nähe des aktuellen Datums / der aktuellen Uhrzeit zurückzukehren. IMO wird der Last-Modified-Header hauptsächlich zum Zwischenspeichern verwendet.
MrWhite
Ich denke, es hat etwas mit Sitemap zu tun ..
Kann Poyrazoğlu
HTTP, das zuletzt geändert wurde, stackoverflow.com/questions/204010/… oder einige semi-standardmäßige HTML-Metadaten: stackoverflow.com/questions/4575967/… sind andere Möglichkeiten, aber ich bin nicht sicher, ob Google sie wirklich verwendet.
Ciro Santilli新疆改造中心法轮功六四事件

Antworten:

4

Sie sollten die XML-Sitemap- oder RSS-Feed-Version durchgehen, um Ihre Veröffentlichungsdaten über die wichtigsten Suchmaschinen wie Google, Yahoo und MSN zu indizieren. Generieren Sie eine XML-Sitemap für Ihre Website und senden Sie sie in den Webmaster-Tools für den Index.

eThan Hunt
quelle
7

Ich hatte gerade das Problem, dass alle meine Hauptseiten vor über vier Jahren als aktualisiert angezeigt wurden, obwohl Google weiß , dass dies nicht zutrifft, da die Seiten so lange indexiert wurden und sich von Monat zu Monat erheblich ändern. Nachdem ich wirklich verwirrt, dann wirklich genervt und dann wieder verwirrt war, fand ich endlich das Problem. Unsere rechtlichen Bestimmungen wurden in einem versteckten Div mit dem Vermerk "Zuletzt aktualisiert: 30. Oktober 2007" veröffentlicht und der Div wurde auf fast allen unseren Seiten geladen. (Weil es bei der Registrierung auftaucht) Ich habe es entfernt und gehe jetzt davon aus, dass das Datum entweder verschwindet oder auf etwas Vernünftigeres korrigiert wird.

Eine warnende Geschichte und ein weiterer Beweis dafür, dass sie die Semantik der Site mehr prüfen als die technischen Details oder ihren eigenen Indexverlauf.

mmdanziger
quelle
Fügen Sie das Datum der letzten Änderung Ihrer Seiten an einer anderen Stelle auf der Seite, im RSS-Feed oder in der XML-Sitemap ein?
MrWhite
Ich nicht, weil die Seite keine Nachrichtenseite ist und ich es vorziehen würde, sie nicht zu betonen. Im Idealfall würde es keinen Termin für meine Homepage geben. Außerdem stelle ich mir vor, dass sie wahrscheinlich den letzten Mod mit einem großen Salzkorn nehmen - ich weiß, ich würde es tun, wenn ich sie wäre.
mmdanziger
7

Ich bezweifle sehr, dass das Veröffentlichungsdatum eines Posts oder Artikels auf dem <lastmod>Eintrag in einer XML-Sitemap (wie von anderen vorgeschlagen) oder dem zuletzt geänderten HTTP-Header basiert . Eine XML-Sitemap ist nur eine Empfehlung, keine verbindliche. Das letzte Änderungsdatum eines Dokuments stimmt wahrscheinlich nicht mit dem (ursprünglichen) Veröffentlichungsdatum eines Artikels überein. Und wie ich in meinem Kommentar oben auf der Seite erwähnt habe, ist das Datum der letzten Änderung eines Dokuments wahrscheinlich wichtiger für das Zwischenspeichern und möglicherweise das Ermitteln der Durchforstungsraten. Die zuletzt geänderten HTTP-Header dynamisch generierter Seiten sind häufig sehr nahe am tatsächlichen Datum / der Uhrzeit (wie dies bei WordPress-Blogs der Fall ist).

Ein RSS / Atom-Feed hingegen enthält dieses spezifische Informationsnugget. Auf Wordpress-Websites, auf denen das Veröffentlichungsdatum nicht im Inhalt enthalten ist, wird das Veröffentlichungsdatum weiterhin in den Suchergebnissen von Google angezeigt. Und soweit ich das beurteilen kann, stimmt dies mit dem Datum im RSS-Feed überein.

EDIT # 1: Ein RSS-Feed enthält jedoch nicht unbedingt alle Seiten. In den meisten Fällen sollte es nur die neuesten oder zuletzt aktualisierten Seiten enthalten. Es gibt jedoch keinen Grund, dass Google vergisst, was es bereits gelesen hat, und dass sich der Inhalt dieser Seite nicht geändert hat, und dass sich auch das Datum der letzten Änderung nicht geändert hat.

Wenn es keinen RSS-Feed gibt, ist Google meiner Meinung nach clever genug, um den Seiteninhalt zu analysieren. Insbesondere, wenn Daten mit Hilfe von Mikroformaten 'semantisch' markiert werden . Es ist durchaus möglich, dass Google Folgendes als maßgebliches Veröffentlichungsdatum für einen darin enthaltenen Artikel ansieht:

<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>

Google liest auf jeden Fall Mikroformate - hCard, hReview usw.

Um es hinzuzufügen, ich glaube nicht, dass Google ein Veröffentlichungsdatum angeben würde, wenn es nicht in der Lage wäre, etwas maßgebliches zu finden, das dies nahelegt. Es wird kein "Veröffentlichungsdatum" für spekulative Daten hergeleitet, da ein falsches "Veröffentlichungsdatum" für niemanden von Nutzen ist und Google viel Geld dafür bekommen würde!

Und nur zur Veranschaulichung (wenn @Tom etwas anderes vorschlägt :) Ich denke, bei Posts / Artikeln sollte das Veröffentlichungsdatum sichtbar angezeigt werden. Viele tun dies nicht, und dies kann für den Leser frustrierend sein, insbesondere wenn er technische Probleme untersucht, und Sie feststellen, dass es nicht mehr aktuell ist, wenn Sie den Artikel zur Hälfte durchgelesen haben!

EDIT # 2: Ich habe seitdem einen ähnlichen Ärger erlebt , den @mmdanziger in seiner Antwort ausführlich beschreibt. Auf einer meiner alten Seiten habe ich oben auf jeder Seite (geschrieben auf die Seite mit JavaScript !!) den Text des Formulars "Site Last Updated Sun 17th Jun 2012" (nicht in besonderer Weise markiert ). Das gleiche Datum wurde von Google aufgenommen und erscheint nun neben einige (aber nicht alle) Seiten , die in dem SERPS erscheinen - dies sicherlich nicht das Datum der Seite veröffentlichen ist. Es sieht so aus, als würde Google einfach die Seite nach einer Zeichenfolge der Form "Zuletzt aktualisiert" durchsuchen ( sieht Datumsangabe )" durchsuchen (nachdem JavaScript verarbeitet wurde !!). Diese Website hat keinen RSS-Feed. Die Site verfügt zwar über eine Sitemap.xml-Datei, die Daten sind jedoch unterschiedlich.

Ich habe ein ähnliches Verhalten auch auf anderen Websites festgestellt.

Herr weiß
quelle
Woran erkennt es das richtige Datum? <div class="footer"> <div class="links"> April 24, 2011 | <a href=...Dies ist der EINZIGE Ort, der auf das Veröffentlichungsdatum meines Posts verweist. Google findet ihn und zeigt ihn korrekt im Suchergebnis an
Can Poyrazoğlu,
Gibt es irgendetwas Spezifisches in dem Anker, der darauf folgt? Andererseits könnte es nicht sein. Haben Sie auch einen RSS-Feed (verknüpft mit den META-Tags des Dokuments)?
MrWhite
Ich habe nach einer Antwort gesucht: "Wie bestimmt Google das Datum?" bemerkte aber das gleiche! Google versucht, eine bestimmte Zeitspanne auf der Seite selbst zu finden, nicht in der zuletzt geänderten Kopfzeile oder in der Sitemap.xml <lastmod>! Vielen Dank für die Bestätigung meiner Gedanken!
Evil Reiko
5

Ich denke, Google verwendet Sitemap und RSS-Feed, um das Veröffentlichungsdatum zu erkennen. Sie können diese Funktion in Ihrem CMS implementieren, indem Sie eine XML-Sitemap gemäß den Standards erstellen .

<lastmod>2011-08-18</lastmod>
Vamsi Krishna B
quelle
2

Laut Jonh Mueller bei Google:

Wir verwenden eine Vielzahl von Signalen, um zu bestimmen, welches Datum angezeigt werden soll oder ob es sinnvoll ist, überhaupt eines anzuzeigen. Es ist nicht an ein bestimmtes Attribut gebunden.

John Mueller - Twitter

Am wahrscheinlichsten finde ich jedoch, dass Google an folgenden Stellen nach Datumsangaben auf Webseiten sucht:

  • Mit maschinellem Lernen auf der Seite gut sichtbar
  • Schema.org strukturierte Daten, insbesondere wenn die Daten auch auf der Seite sichtbar sind
Maximillian Laumeister
quelle
1

Ich denke, es sucht auf intelligente Weise nach Daten auf der Seite und wenn es sicher ist, dass es das relevante Datum ist, wird es verwendet.

Es ist manchmal etwas schwierig, da ich denke, dass es einen negativen Einfluss auf die SERP-Klickfähigkeit haben kann. Ich nehme an, dass es einen temporären positiven Einfluss haben kann, wenn es sich um einen aktuellen Artikel / Post handelt, aber ich bin mir ziemlich sicher, dass meine Websites ohne ihn besser dastehen würden (Google-Sucher sind ohne das Programm möglicherweise nicht besser dran!)

Es gibt keine Optionen zur Steuerung über Google, nur mit Ihren eigenen Methoden. Du kannst entweder:

  • Ersetzen Sie Daten durch dynamisch generierte Bilder, um zu verhindern, dass Google sie entdeckt. Dies kann jedoch zu anderen Problemen führen, wie z. B. visuelle Ausrichtung / konsistente Schriftanzeige / Barrierefreiheit usw.
  • Entfernen Sie alle Daten von den Seiten (dies kann wiederum für Besucher / Benutzer frustrierend sein, wenn sie das Alter einer Quelle ermitteln möchten, wenn Sie relevante Informationen haben).

Aus diesen Gründen würde ich es einfach ignorieren.

Tom Gullen
quelle
Ich versuche nicht, das Datum zu entfernen :) Ich versuche, das Datumsfeature einer neuen Website hinzuzufügen, die ich gerade erst baue.
Can Poyrazoğlu