Normales Verhältnis von Cookies zu "Besuchern"?

31

Wie in einem kürzlich veröffentlichten Blog-Beitrag festgestellt , besteht eine große Diskrepanz zwischen den "Besuchern" von Google Analytics und den "Besuchern" von Quantcast.

Aus Gründen, die wir nie herausgefunden haben, erhält Google Analytics nur eine größere Anzahl als Quantcast. Derzeit zeigt GA allein auf stackoverflow.com mehr Besucher (15 Millionen) als Quantcast im gesamten Netzwerk sieht (14 Millionen):

Warum? Ich weiß es nicht. Entweder verliert Google Analytics manchmal Cookies oder Quantcast vermisst Besucher. Zählen ist eine ungenaue Wissenschaft.

Wir glauben, das liegt daran, dass Quantcast ein konservativeres Verhältnis von Cookies zu Besuchern verwendet . Während Google Analytics möglicherweise jeden Cookie als "Besucher" betrachtet, betrachtet Quantcast nur alle 1.24 Cookies als "Besucher". Dies ist für mich sinnvoll, da Benutzer von mehreren Computern, mehreren Browsern usw. aus auf unsere Websites zugreifen können.

Ich habe zwei eng verwandte Fragen:

  1. Gibt es ein akzeptiertes Standardverhältnis von Cookies zu Besuchern? Dies ist offensichtlich eine ungenaue Wissenschaft, aber gibt es eine neue Faustregel?

  2. Gibt es eine genauere Möglichkeit, "Besucher" einer Website zu zählen, als sich auf Browser-Cookies zu verlassen? Oder wird dies immer eine Art bestmögliche Schätzung sein, egal wie Sie es messen?

Jeff Atwood
quelle
Quantcast verwendet definitiv Cookies, oder? Sie gehen nicht nur auf IP-Adresse oder so?
DisgruntledGoat
@disgruntledgoat Ich habe gerade die Website überprüft: "Quantcast liefert Audience-Daten sowohl für die Anzahl der eindeutigen Cookies als auch für die Personen."
Matthew Brookes
@ DisgruntledGoat überprüfen Sie diese Seite. Es hat Cookies von quantserve.com.
Yahel

Antworten:

14

Quantcast hat mir eine E-Mail geschickt:

Sie haben erwähnt, dass zwischen Ihren GA-Zahlen und Ihren QC-Zahlen ein recht erhebliches Delta besteht. Dies kommt zwar nicht oft vor, aber es gibt verschiedene Gründe dafür. Beispielsweise berücksichtigen wir Cookies von Drittanbietern und führen automatische Aktualisierungen durch, GA jedoch nicht. Wir fordern die Verlage außerdem auf, unser Tag unten auf der Seite zu platzieren, um den MRC- und IAB-Standards zu entsprechen. Wenn sich Ihre anderen Mess-Tags weiter oben auf der Seite befinden, können sie ausgelöst werden, wenn dies bei Quantcast nicht der Fall ist. (Wir sind der einzige von MRC akkreditierte Dienst zur Verkehrsmessung.) Außerdem werden die Zahlen aus Zeitzonengründen niemals exakt gleich sein - wir verwenden eine Normalisierungsfunktion und GAs sind festgelegt.

Wenn Sie mehr darüber erfahren möchten, wie wir unsere Zahlen ermitteln, besuchen Sie bitte: http://www.quantcast.com/how-we-do-it . Wir haben auch Whitepaper zu unseren cookiekorrigierten Zielgruppendaten und unserer Methodik hier.

Ich sehe in den Whitepapers, dass sie tatsächlich das tun, was Jeff vorschlägt: die "offiziellen" Zahlen zu fummeln, um etwas zu erhalten, von dem sie denken, dass es näher an der wahren Anzahl von Menschen liegt. Sie haben ein Cookie Corrected Audience White Paper (PDF-Link), das impliziert, dass ihr System ziemlich ausgefeilt ist, nicht so einfach wie das Teilen durch eine magische Zahl:

Das Programm Quantcast Quantified Publisher erfasst monatlich über 75 Milliarden Medienkonsumereignisse, die von mehr als 1,4 Milliarden Cookies generiert wurden (Stand Juni 2008). Darüber hinaus teilen viele unserer Quantified Publisher-Partner anonyme Kennungen mit uns, die von Cookies unabhängig sind. Unser Modell enthält auch mehrere Panels, die personenbezogene Referenzpunkte und Kalibrierungen ermöglichen, ohne dass Cookies gelöscht werden müssen. Wir triangulieren über diese Datenmenge hinweg mit verschiedenen Erfassungsprozessen, Vorurteilen und Problemen. Unsere Modelle berücksichtigen die Häufigkeit von Besuchen, Zeiträume, die Wahrscheinlichkeit der Verwendung mehrerer Computer und sogar die Auswirkungen mehrerer Personen, die denselben Computer verwenden, um personenbezogene Schätzungen zu liefern. Unser Modell für die Übersetzung eindeutiger Cookies für Personen wurde anhand von Hold-out-Beispielen und unabhängigen Datensätzen validiert. Darüber hinaus ist unser Modell dynamisch und wird fortlaufend neu kalibriert, um die Entwicklung der Internet-Verkehrsmuster widerzuspiegeln.

Joel Spolsky
quelle
2
Interessant. Letzterer Auszug ist informativer (und überzeugender) als der erste. GA muss keine Cookies von Drittanbietern berücksichtigen, da Cookies von Erstanbietern verwendet werden. Ja, Zeitzonenunterschiede ändern die genauen Zahlen, aber über Monate hinweg ist es äußerst unwahrscheinlich, dass signifikante Messungsunterschiede berücksichtigt werden.
Yahel
27

Bei der Unterzählung von Quantcast spielt ein weiterer Faktor eine Rolle: Sie verwenden Cookies von Drittanbietern (von der .quantserve.comDomain gelieferte Cookies ), während Google Analytics Cookies von Erstanbietern ( stackexchange.comusw.) verwendet.

Dies ist von entscheidender Bedeutung, da einige Browser (insbesondere Safari, aber neuerdings Firefox und Chrome) Cookies von Drittanbietern als Standardeinstellung deaktivieren und viele andere möglicherweise individuell Datenschutzeinstellungen festlegen, die Cookies von Drittanbietern ausschließen. Dies bedeutet, dass es eine Teilmenge der Population gibt, die von QuantCasts Cookies niemals erfasst wird. Inhärent bedeutet dies, dass Google Analytics immer eine höhere Besucherzahl zurückgibt.

Ich würde sagen, es gibt keine Faustregel. Als Analytiker würde ich sagen, dass die Suche nach einer "wahren" Besucherzahl aussichtslos ist und sich stattdessen auf die Besuche selbst konzentriert. In Ihrem Google Analytics-Konto sind beispielsweise mindestens 8 verschiedene Besucher angemeldet, die von Chrome, Safari und Firefox über meinen Arbeits-Laptop, meinen persönlichen Laptop, mein Telefon und mein iPad auf StackOverflow zugegriffen haben. Analytics-Services zählen alle auf unterschiedliche Weise und geben daher alle signifikant unterschiedliche Zahlen zurück.

Selbst bei perfekter Implementierung weist Google Analytics fast immer eine geringere Anzahl von Besuchen auf als ein Server-Log-basiertes Analysesystem, jedoch eine höhere Anzahl von Besuchen als ein Cookie-basiertes System eines Drittanbieters wie Quantcast. Das Wichtigste ist nicht, die rohen Summen zu betrachten, sondern die Trends, die jede Methode in ihren Stärken zeigt. Vergleichen Sie also niemals Quantcast-Zahlen mit Google Analytics-Zahlen. Verwenden Sie stattdessen die Zahlen in den Kontexten, in denen sie gesammelt wurden.

Ein weiteres Problem könnte sein, dass Ihre Google Analytics-Implementierung nicht korrekt ist, da die Konfiguration für eine Einrichtung mit mehreren Domains und Subdomains ein Albtraum sein kann, wenn sie nicht korrekt und konsequent durchgeführt wird. Dies kann dazu führen, dass ein einziger Browser als solche eingestuft wird mehrere Besucher, die selbst Ihre Zählung aufblasen. Dies ist für Quantcast kein Problem, da alle Cookies auf die Domain eines Drittanbieters gesetzt werden.

Yahel
quelle
Google Chrome scheint auch standardmäßig Cookies von Drittanbietern zu blockieren.
MrWhite
7

Das Verhältnis von Cookies zu einzelnen Besuchern liegt bei Websites mit mehr als einer Million Besuchen in der Regel zwischen 1,3 und 1,7.

Während yc01 richtig ist, dass GA Erstanbieter-Cookies im Vergleich zu Drittanbieter-Cookies verwendet, verwenden wir bei RealSelf.com zwei Erstanbieter-Analytics-Anbieter (GA und Comscore Direct) und GA zeigt immer noch 30% mehr absolute eindeutige Besucher als die eindeutigen Besucher von Comscore.

Comscore zeigt nur eindeutige Besucher nach Land. Um GA mit Comscore zu vergleichen, müssen Sie die Anzahl der absoluten eindeutigen Besucher in den USA wie folgt berechnen:

US Visits / Global Visits * Absolute Unique Users

(1.150.110 / 1.650.979) * 1.273.059 = 886.842 Unique User in den USA

Im Gegensatz dazu meldet Comscore 680.900 Unique User in den USA. GA zeigt also 30,2% mehr.

Comscore hat sein Geschäft darauf ausgerichtet, genau zu sein, während GA in erster Linie eine kostenlose Möglichkeit ist, Websites zu verfolgen und zu optimieren, die AdWords und AdSense verwenden. Comscore verfügt über eine Gruppe von Personen, anhand derer der Datenverkehr geschätzt wird. In dieser Gruppe wird die durchschnittliche Anzahl von Cookies pro Person ermittelt. Wenn mehr Menschen mobile Geräte verwenden (unsere mobile Auslastung beträgt 15%), ist es sinnvoll, dass eindeutige Cookies die Anzahl der eindeutigen Personen übersteigen.

Eric K
quelle
"Das Verhältnis von Cookies zu einzelnen Besuchern liegt normalerweise zwischen 1,3 und 1,7 für Websites mit mehr als einer Million Besuchen." Ist das eine von Comscore veröffentlichte Figur?
Ciaran
das ist überraschend genau für uns; Ich habe die UserSessionTabellenstatistiken auf einigen Sites ausgeführt und sie reichen von 2.0 (Stack Overflow) bis 1.46 (webapps.se), wobei alles andere dazwischen liegt. 1.6 scheint ein sehr vernünftiger Standard für tech-zentrierte Websites zu sein.
Jeff Atwood
4

Hier ist eine aktuelle Studie (4. Mai 2011 - gestern, als ich diese schreibe) von MediaMind mit "Cookie Inflation Multiplikatoren" für verschiedene Märkte:

Ihr berechneter Inflationsfaktor liegt zwischen 2,2 für Deutschland und 3,0 für die USA.

Theo
quelle
das ist exzellent - genau die Art von Referenz, die ich gesucht habe
Jeff Atwood
2

Vielleicht sind Ihre GA-Besucherzahlen aufgrund der eher technischen Ausrichtung des Publikums überhöht als bei einer normalen Website? Beispielsweise verwenden Programmierer, insbesondere Webentwickler, mit größerer Wahrscheinlichkeit eine Reihe von Browsern und erhöhen so die Anzahl der Cookies.

Bei Frage 1 denke ich, dass es wie bei vielen Metriken besser ist, Daten von Ihrer eigenen Site zu verwenden, als nach globalen Standards zu suchen, da Aggregate irreführend sein können. Eine Möglichkeit, einen Cookie auf die tatsächliche Besucherzahl zu bringen, besteht darin, zu zählen, wie viele Cookies Sie von jedem registrierten Benutzer sehen, und daraus die Anzahl abzuleiten.

In Bezug auf Nummer 2 wäre es theoretisch die beste Methode, echte Besucher zu zählen, wenn jeder gezwungen würde, ein Konto zu registrieren. Da dies offensichtlich keine gute Idee ist, könnte man sich die Normalisierung ansehen. Sie können beispielsweise die oben vorgeschlagenen durchschnittlichen Cookies für registrierte Benutzer verwenden und sie auf die von GA gemeldeten Besucherzahlen anwenden.

Ewan Heming
quelle
Das ist ein großartiger Punkt. Bei Stack Overflow haben wir derzeit 531.484 Sitzungen, von denen 261.547 auf eindeutige Benutzer verweisen - also im Grunde 2 Cookies pro Benutzer.
Jeff Atwood
-1

Ich denke, IP ist vertrauenswürdig ... wenn ich ein Statistiksystem wie GA mit Python erstelle, verwende ich eine Methode wie diese

  • Cookie an den Browser senden und alle Agentendaten in die Datenbank übertragen
  • Einfache Möglichkeit, wenn ein neuer Besuch ein Cookie hat, ist dies kein neuer Besuch. Daher speichere ich es als nicht neuen Besuch.
  • speichere Benutzer IP und eine ID für diesen Benutzer und IP und Cookie (speichere es auch in Cookie)
  • Ein neuer Benutzer kommt und hat kein Cookie ... ist diese IP neu? Ja? OK, sein neuer Benutzer nur greifen Benutzer-Agent und IP / Nr? Wie oft kommt dieser Benutzer? mehr als grenzenlos? nicht wirklich neuer besuch, nicht mehr mit diesem user agent? OK das ist neu ...: D

Diese Methode ist fehlerhaft, aber nicht schlecht und fast gültig. (Dies hängt auch von der Verzögerungszeit ab, um einen neuen Benutzer zu finden (Verzögerung zwischen zwei Besuchen) und der Versuchszeit für Benutzer ohne Cookie.)

Mohammad Efazati
quelle
5
Wie würde dies zum Beispiel mit einem Unternehmen mit vielen verschiedenen Entwicklern umgehen, die hinter einem NAT auf StackOverflow zugreifen? Würden sie alle als ein Besucher gezählt?
Svish
3
Der IP-Aspekt davon ist wirklich fehlerhaft. Die IP-Adresse ist keine eindeutige Kennung.
Yahel
Es gibt Zeit, dies zu versuchen. Wir überprüfen den Agenten und andere Dinge und können eine IP mehr als 100 Mal hinzufügen. Der vorgeschlagene Weg, um einen echten Benutzer hinter einem NAT zu finden
Mohammad Efazati