Warum sendet Coffeyville, Kansas, große Mengen an Datenverkehr in Google Analytics?

9

Ich arbeite für ein in Großbritannien ansässiges Unternehmen mit digitalem Fokus.

Wir haben einige tausend Benutzer in den USA, aber es ist keineswegs unsere Hauptregion.

Es wird jedoch behauptet, dass ein übermäßig großer Teil des US-Verkehrs aus Coffeyville, Kansas, kommt - so sehr, dass er sich als die Stadt mit den meisten Sitzungen weltweit zeigt.

Gibt es einen bestimmten Grund, warum Coffeyville Kansas überrepräsentiert ist? Eine flüchtige Suche deutet darauf hin, dass Google eine gewisse Geschichte mit Coffeyville hat ( anscheinend war dies einst die Standardposition in der Google Maps-API ).

Ist dies eine Folge davon, dass Google die Stadt der US-Nutzer falsch ermittelt hat? Oder spielt etwas Unheimlicheres eine Rolle (z. B. falsche Verweise / Spam)?


UPDATE: Ich habe mich eingehender mit dem Problem befasst und versucht, einige der hier gemachten Vorschläge zu untersuchen (danke für die bisherigen Vorschläge).

Es stellt sich heraus, dass der 'Coffeyville'-Verkehr fast ausschließlich von einem Content-Werbenetzwerk / Partner geleitet wird, der hauptsächlich US-Verkehr auf unsere Website leitet. Infolgedessen ist der Verkehr seit Juni 2017, seit Beginn der Partnerschaft, fast vollständig aufgetreten.

Ich habe das Problem mit dem oben genannten Partner angesprochen und werde es aktualisieren, wenn er weitere Informationen hat.

Ich habe noch keinen Zugriff auf IP-Serverprotokolle, werde dies jedoch prüfen, wenn der Partner das Problem nicht beleuchten kann.

Rhys Mills
quelle
In welchem ​​Zeitraum? Es besteht die Möglichkeit, dass ein außer Kontrolle geratenes Programm oder ein infizierter Computer das Problem verursacht und möglicherweise herausgefunden und heruntergefahren wird.
Rob
Es wäre hilfreich, einen Beispielzugriff aus Ihren Webserver-Protokolldateien zu veröffentlichen. Es könnte sich um einen Hack-Angriff oder ein anderes Problem handeln, das Sie ansprechen möchten. Prost!!
Closetnoc

Antworten:

11

Es scheint, dass Sie ein Opfer des sogenannten " Kansas-Problems " sind.

Laut dem US Geological Survey ist das geografische Zentrum der konterminösen Vereinigten Staaten: 39°50'N 98°35'Wnordwestlich des Libanon, Kansas.

Geben Sie hier die Bildbeschreibung ein

Wenn ein Geolokalisierungsdienst nach "USA" sucht, wird daher im Wesentlichen ein Punkt an vordefinierten Koordinaten gelöscht, der als Zentrum der angrenzenden USA (irgendwo in Kansas) betrachtet wird, und herausgezoomt, um die vollständige Karte anzuzeigen.

Wie Sie in Ihrer Frage betont haben, war die Standard-Zoomposition für frühe Google Maps und Google Maps-API das, was Google als Zentrum der Vereinigten Staaten definiert hat 37.0625, -95.677068, das sich in Coffeyville, Kansas, befindet.

Ist die Fülle des Verkehrs aus Coffeyville, Kansas, eine Folge der falschen Ermittlung der Stadt der US-Nutzer durch Google?

Nicht genau.

Google beschreibt, wie Google Analytics den Standort von Verkehrsquellen ermittelt:

Analytics bietet eine Reihe von geografischen Dimensionen wie Stadt, Land, Kontinent usw. Die Werte für diese Dimensionen werden automatisch aus der IP-Adresse des Treffers abgeleitet ...

Google erklärt auch , was passiert, wenn ein Standort nicht genau bestimmt werden kann:

Google Analytics verwendet eine Datenquelle eines Drittanbieters, um die geografischen Standorte Ihrer Besucher zu ermitteln. Wenn unser Drittanbieter keine genaue Aufzeichnung des Besucherstandorts hat, zeigt Google Analytics einen (nicht festgelegten) Eintrag an.

Mit anderen Worten, Google sendet die IP-Adresse der Verkehrsquelle an eine Datenquelle eines Drittanbieters, um den Standort zu bestimmen.

Wenn die Quelle eines Drittanbieters feststellt, dass der Standort des Besuchers genau aufgezeichnet wurde, füllt Google Analytics die Felder mit den Standortdaten. Wenn die Quelle eines Drittanbieters feststellt, dass der Speicherort nicht gefunden werden kann, lautet der Wert in den entsprechenden Feldern : (not set).

Wenn Coffeyville, Kansas, ein falscher Ort für Ihre Verkehrsquellen ist, liegt dies anscheinend an einer der von Google verwendeten Datenquellen von Drittanbietern und nicht an Google selbst.

Google gibt nicht an, welche IP-Adress-Geolokalisierungsdatenbank / welcher Geolokalisierungsdienst verwendet wird. Einige der beliebtesten Datenbanken scheinen jedoch Folgendes zu umfassen:

MaxMind schrieb auf ihrer Website :

Weltweit nutzen mehr als 5.000 Unternehmen GeoIP2 Intelligence, einschließlich der Mehrheit der 50 besten Web-Eigenschaften (von Alexa - Juli 2017).

Andererseits schrieb Neustar am 6. April 2017 auf ihrer Website :

Neustar, Inc. (NYSE: NSR), ein vertrauenswürdiger, neutraler Anbieter von Echtzeit-Informationsdiensten, gab heute eine neue Partnerschaft für fortschrittliche Marketinganalysen mit Google bekannt.

Dies bedeutet, dass Google (zumindest teilweise) sehr gut mit MaxMind und / oder Neustar für Geolokalisierungsdaten für IP-Adressen von Google Analytics zusammenarbeiten könnte.

MaxMind hatte in der Vergangenheit Probleme mit den Standardkoordinaten, die sie für das geografische Zentrum der USA eingerichtet hatten 38.0000, -97.0000.

Dies ist in Potwin, Kansas (nur etwa 100 Meilen von Coffeyville, Kansas entfernt), und auf diesen Ort wurde hingewiesen, als sich ein unbekannter Ort in den USA präsentierte .

Geben Sie hier die Bildbeschreibung ein

Bildquelle: https://techviral.net/600-million-ip-addresses-are-linked-to-this-house/

Betrachten Sie die folgende SQL-Abfrage:

SELECT
    *
FROM
    database.maxmind_geoip
WHERE
    location_id = 12345

MaxMind könnte etwa das folgende Ergebnis liefern:

+-------------+---------+--------+------+-------------+----------+-----------+----------+-----------+
| location_id | country | region | city | postal_code | latitude | longitude | dma_code | area_code |
+-------------+---------+--------+------+-------------+----------+-----------+----------+-----------+
|       12345 | US      |        |      |             |       38 |       -97 |          |           |
+-------------+---------+--------+------+-------------+----------+-----------+----------+-----------+

Quelle: http://p5k6.github.io/blog/2014/08/09/understanding-your-geoip-data/

Laut einem Artikel über Splinter hat MaxMind am 12. April 2016 diesen Ort, nachdem er von verärgerten Immobilienbesitzern verklagt wurde, in die Mitte des Cheney Reservoirs in Kansas verlegt. Dies ist etwas weiter entfernt: etwa 130 Meilen von Coffeyville, Kansas entfernt.

Fazit:

Ich bin der Meinung, dass eine der Geolokalisierungsdatenquellen von IP-Adressen von Drittanbietern auf der Grundlage der oben genannten Beweise den spezifischen Standort bestimmter IP-Adressen nicht genau erkennt und dennoch feststellt, dass sich die IP-Adresse in den USA befindet.

Anstatt mit einer "nicht gefundenen" Antwort zu antworten, leitet die Quelle ein falsches Ergebnis, das die "Zentrumskoordinaten" der USA (Coffeyville, Kansas) angibt, an Google Analytics weiter.

Grant Miller
quelle
1
Hervorragende Antwort und Beschaffung, es kommt heutzutage nicht oft vor, dass ich aus Antworten etwas Neues lerne, wie ich es daraus gemacht habe. Gut gemacht.
dan
Es kann erwähnenswert sein, dass dies mit der IP-Adresse für Googles Crawler-Bot zu geschehen scheint: whatismyipaddress.com/ip/66.249.79.135
DaveTheMinion
Die Person, die dieses Haus verlässt, kann buchstäblich alles online tun :) keine Möglichkeit, ihn als die IP zu bezeichnen, die etwas getan hat.
adrianTNT
1

Sehen Sie sich Ihre Serverprotokolle an und prüfen Sie, ob Sie eine IP-Adresse (oder einen kleinen Bereich) finden, die Ihnen viele Treffer sendet. Versuchen Sie, die IPs in einem Online-Tool wie ip-lookup.net nachzuschlagen, das Ihnen einen Standort und eine Domain oder einen ISP angibt, mit denen die IP verknüpft ist.

In Ihren Serverprotokollen sollten die Zeilen mit diesen IPs eine Benutzeragentenzeichenfolge (Browsername) haben. Das kann Ihnen einen Hinweis geben, was passiert, wenn beispielsweise "Googlebot" angezeigt wird. Wenn nicht, durchsuchen Sie die IP-Adressen in Google selbst, um festzustellen, ob sie zu einem bekannten Unternehmen gehören.

DisgruntledGoat
quelle
0

Also werden wir alle "The Black Mailbox" direkt bei diesen mysteriösen 38.0000, -97.0000Koordinaten ignorieren ?! OK :)

Geben Sie hier die Bildbeschreibung ein

adrianTNT
quelle