Ich baue meine Website so, dass sie einige benutzeridentifizierende Cookies enthält. Wenn sich ein Besucher anmeldet, setze ich ein Cookie mit einer eindeutigen Besucher-ID (Guid) und dem Datum und der Uhrzeit des Besuchs und speichere einen Besuchsdatensatz (einschließlich seines Benutzeragenten, Referners (falls vorhanden) usw.) Ich plane, jeden Benutzer zu überprüfen, ob er das von mir gesetzte Cookie hat, und dann jedes Mal, wenn er vorbeikommt, einen Besuchsdatensatz zu erstellen, um anzugeben, ob er auf Links auf meiner Website klickt.
Die Website ist sehr, sehr neu (bis heute nur etwa eine Woche alt), aber ich habe meine Besucher in einem Textprotokoll verfolgt und sehe, dass ich Besuchs-Bots anhand ihrer Benutzeragenten (Google- und Bing-Bots /) identifizieren kann. Crawler sind vorbeigekommen, zusammen mit ein paar anderen).
Mir fällt ein, dass sie Cookies wahrscheinlich nicht akzeptieren. Weiß jemand das sicher? Oder sammeln sie neben Site-Informationen auch Cookies?
quelle
Antworten:
Die meisten Bots akzeptieren keine Cookies (einschließlich Googlebot), einige Bots jedoch.
Sie senden einen
Set-Cookie
Header in der Antwort, aber der Bot sendetCookie
bei nachfolgenden Anforderungen keinen Header zurück, sodass das Cookie effektiv verloren geht. Ob Google überwacht , ob die Site Einstellung Cookies, wissen wir nicht sicher, aber ich würde wetten , sie wahrscheinlich sind. Diese Informationen werden jedoch nicht in den Suchergebnissen verwendet.Wenn Googlebot Ihre Website besucht, ist dies so, als hätten sie sie noch nie zuvor besucht. Dies gilt für echte Nutzer, die ihre Cookies deaktiviert haben.
Lesen Sie weiter: Hält Googlebot die Sitzung beim Crawlen aufrecht?
Eine Möglichkeit, mit der Situation der Generierung einer eindeutigen Besucher-ID (Guid) umzugehen, besteht darin, ... wenn das Cookie nicht vorhanden ist (entweder ein neuer Benutzer oder das Cookie wurde aus irgendeinem Grund nicht gesetzt), versuchen Sie, ein Cookie mit zu setzen Ihre echte Guid, aber verwenden Sie einen Hash des Benutzeragenten und der IP-Adresse als Guid für die aktuelle Anforderung (die sich von der echten Guid unterscheidet). Es ist nicht perfekt (es ist nicht ganz einzigartig), aber es ermöglicht Ihnen zumindest, die Bots einfacher zu verfolgen und vermeidet vor allem das Zählen von Tausenden unwirklicher Besucher (wenn Sie sich ausschließlich auf ein Cookie verlassen, um Besucher zu zählen).
quelle