Wie kann ich Google Analytics Referrer-Spammer abwehren?

43

In den letzten Monaten habe ich viele Referrer-Spammer in meinen GA-Statistiken. Ihre Anzahl ist ~ 10x höher als die Anzahl der legitimen Besucher (meine Seite ist noch nicht sehr beliebt). Ich habe die Option aktiviert, bekannte Spammer in den GA-Einstellungen zu verbergen, aber das hat überhaupt nicht geholfen. Es scheint, dass diese Spammer Skripte verwenden, um direkt an GA zu spammen (dh, sie sind nicht in meinem IIS angemeldet).

Kann ich irgendetwas tun, um diese Spammer zu stoppen?

UPD 10 Monate später haben sie angefangen, mit gefälschten Zielseitennamen zu spammen ... und Google unternimmt immer noch nichts dagegen.

user626528
quelle
1
Bitte überprüfen Sie Ihre Log-Dateien auf Treffer mit Referrer-Spam und lassen Sie uns wissen, wenn Sie welche sehen. Wenn du kannst, bearbeite bitte die Frage und gib den fraglichen Referrer-Spam an. Ich vermute, ich kenne die Antwort schon. Ich mache einige Nachforschungen und in letzter Zeit gibt es eine ganze Reihe von Empfehlungsaktivitäten, von denen ich einige selbst erlebt habe. Wenn Sie WordPress installiert haben, vergewissern Sie sich bitte, dass es auf dem neuesten Stand ist. Eine der Websites scheint auch nach WP-Schwachstellen zu suchen. Besuchen Sie auch keine dieser Websites, es sei denn, Sie verwenden einen Textbrowser wie Curl.
Closetnoc
@closetnoc, diese Spammer sind nicht auf meinem Server angemeldet. Wie ich schrieb, spammen sie direkt zu GA. Ich benutze kein WP. "beziehe den fraglichen Referrer-Spam ein" - was meinst du?
User626528
Ich weiß, wer sie sind und habe eine Antwort gepostet.
Closetnoc
Die beste und einfachste Möglichkeit, dies zu verhindern, ist die Verwendung von referrerspamblocker.com. Hierbei handelt es sich um eine automatisierte Einrichtung von Filtern in Google Analytics. Ich benutze es seit Monaten.
Rody van Sambeek
Kann das Problem dadurch behoben werden, dass in den Google Analytics-Einstellungen "Bot-Filter" auf "true" gesetzt wird? - lunametrics.com/blog/2014/08/07/…
sam

Antworten:

7

Der Spam gerät außer Kontrolle. Die Liste wächst und es ist zeitaufwändig und nicht einmal effizient, für jeden Spammer einen Filter hinzuzufügen, da die meisten von ihnen für ein paar Tage auftauchen und dann verschwinden und ein neuer kommt.

Es gibt viele Fehlinformationen, der häufigste Fehler ist die Empfehlung, die .htaccess- Datei zu verwenden . Diese Datei blockiert den Zugriff auf die Website, obwohl es ein paar Crawler gibt (5 oder 6), die den größten Teil des Spam blockieren können Niemals auf Ihre Website zugreifen ist Ghost Spam.

Der beste Weg , um diese Art von Spam (Ghosts) zu stoppen, besteht darin, einen gültigen Hostnamen-Filter zu erstellen. Bei Ghost-Spam wird entweder ein falscher oder ein nicht festgelegter Hostname verwendet. Mit diesem Filter müssen Sie also keine endlosen Filter hinzufügen. Ein Filter wird benötigt Pflege der alten und neuen Spam. . Ich benutze diese Lösung seit 3 ​​Monaten erfolgreich

Weitere Informationen zu dieser Methode finden Sie hier:

https://stackoverflow.com/a/28354319/3197362

Carlos Escalera Alonso
quelle
Ich bin froh, dass dies die akzeptierte Antwort ist, es sollte wirklich mehr geschätzt werden. Die überwiegende Mehrheit der Spam-Referer in Analytics sind Ghost-Referer. Es gibt einige, mit denen Sie blocken müssen .htaccess, aber das ist ein ständiger Kampf, um zu verhindern, dass sie die Zahlen verdrehen (Semalt ist der Hauptschuldige dafür - der legitime Bot meiner Tante Fanny).
GeoffAtkins
Oh Carlos, ich werde den Leitfaden zur Bekämpfung von Spam auf Ihrer Website empfehlen . Ich weiß, dass dieser Kommentar als ein Weg zur Suchmaschinenoptimierung / zum Verkauf angesehen wird, aber das ist nicht der Fall. Ich bewundere Ihre Beiträge zu diesem Leitfaden wirklich.
Ooker
35

Okay. Ohne die fraglichen Websites zu kennen, werde ich versuchen, ein bisschen zu erklären, was gerade passiert, und ich werde nur ein paar Links bereitstellen.

Von: http://www.cradlecloud.com/ban-block-blackhatworth-com-spam-referrals/

Ich erhalte die folgenden Domain-Namen, die mit der neuen Methode von Referrer-Spam zusammenhängen, die die Leute in letzter Zeit sehen.

  • BlackHatWorth.com
  • Iskalko.ru
  • Lomb.co
  • Lombia.co
  • Econom.co
  • Darodar.com
  • ILoveVitaly.Com
  • Priceg.com
  • Hulfingtonpost.com (neu hinzugefügt am 16. Januar 2015)
  • Bestwebsitesawards.com (neu hinzugefügt am 3. Februar 2015)
  • Ranksonic.info (Neu hinzugefügt am 3. Februar 2015)
  • Cenoval.ru (neu hinzugefügt 6. Februar 2015)
  • oo-6-oo.com (Neu- hinzugefügt am 25. Februar 2015)
  • Humanorightswatch.org (Neu hinzugefügt 4. März 2015)
  • S.click.aliexpress.com (neu hinzugefügt 17. März 2015 - vermutet)
  • www1.social-buttons.com (Neu hinzugefügt 23. März 2015 - vermutet)
  • 4webmasters.org (Neu hinzugefügt am 26. März 2015 - Verdacht)
  • Googlsucks.com (Neu hinzugefügt am 07. April 2015)
  • Addons.mozilla.org (Neu hinzugefügt: 07.04.2015 - Verdacht)
  • Smallseotools.com (Neu hinzugefügt am 13. April 2015 - vermutet)
  • Theguardlan.com (Neu- hinzugefügt am 14. April 2015)
  • Buy-cheap-online.info (Neu- hinzugefügt am 16. April 2015 - vermutet)
  • Site1.free-share-buttons.com (Neu hinzugefügt am 29. April 2015 - vermutet)
  • Sanjosestartups.com (Neu- hinzugefügt am 25. Mai 2015)
  • Trafficmonetize.org (neu hinzugefügt am 3. Juni 2015 - vermutet)
  • Howtostopreferralspam.eu (Neu hinzugefügt am 9. Juni 2015 - Verdacht)
  • Www10.free-social-buttons.com (Neu hinzugefügt am 16. Juni 2015 - vermutet)
  • Getitfree.us (Neu hinzugekommen: 18. Juni 2015 Eigentümer kann nicht ermittelt werden. Vielen Dank - Trey Copeland)
  • Www6.free-social-buttons.com (Neu hinzugefügt am 18. Juni 2015 - vermutet)
  • Erot.co (Neu hinzugefügt 26. Juni 2015 - Verdacht)
  • 3g2upl4pq6kufc4m.onion (Neu hinzugefügt am 4. Juli 2015 - vermutet)
  • Traffic2money.com (Neu hinzugefügt am 28. Juli 2015 - vermutet)

Hinweis: Verdächtige Gegenstände scheinen dem gleichen Eigentumsmuster zu folgen und sind möglicherweise nicht an denselben Täter gebunden.

Eine ziemlich vollständige Liste der von Piwik verwalteten Spam-Verweise finden Sie hier: https://github.com/piwik/referrer-spam-blacklist/blob/master/spammers.txt (Vielen Dank - user2428118)

Zitieren:

BlackHatWorth.com ist eine relativ neue Domain, die erst am 7. Januar 2015 erstellt wurde und nun für Empfehlungs-Spam verwendet wird. Tatsächlich wird diese Empfehlungs-Spam-Website hinter dem Namen der Suchmaschine für Einkäufe und schönen Landschaftsbildern versteckt.

... die IP-Adresse von BlackHatWorth.com mit der Nummer 78.110.60.230 ist dieselbe, die auch mit anderen Spam-Websites für Empfehlungen in Verbindung gebracht wird ...

Tatsächlich gehört die Domain BlackHatWorth.com demselben Russen, der auch die anderen Empfehlungs-Spam-Domains wie ILoveVitaly.com, Econom.co und Darodar.com besitzt. Der Name des Domaininhabers lautet angeblich Vitaly A Popov aus Samara (Stadt), Oblast Samaraskaya (Bundesstaat), Russland.

Sie können dies nicht blockieren!

Von: http://www.blackmoreops.com/2014/12/19/darodar-com-referrer-spam/

Zitieren:

Hier finden Sie eine kurze Einführung in die Funktionsweise von Google Analytics.

Sie werden also auf GA eingerichtet und erhalten von diesen einen Code. Der Code sieht aus wie UA-Nummer-1 oder so. Diese Nummer ist Ihre "Kontonummer" auf GA. Nun werden dieser Code und ein bisschen Javascript auf Ihre Webseite übertragen. Jetzt besucht jemand Ihre Seite und ihr Browser führt diesen Javascript-Code aus.

Dieser Javascript-Code zeichnet ihren Besuch auf. Dadurch wird der Browser mit Google Analytics in Verbindung gebracht. Insbesondere werden bestimmte Arten von HTTP-Anforderungen erstellt, zu denen Google Informationen aufzeichnet, und GA zeigt Ihnen dann Zusammenfassungen dieser Informationen an.

Ziemlich einfach, oder? Immer noch bei mir? Okay, jetzt, wenn alles, was es ist, dieses Javascript ist, das ihnen den "Besuch" schickt, dann kann das jeder vortäuschen. Jedermann überhaupt. Alles, was ich tun muss, um Ihre GA zu veranlassen, falsche Informationen anzuzeigen, ist, meine gefälschten Informationen direkt an GA zu senden.

Ich muss Ihre Site überhaupt nicht besuchen. Ich muss kein Javascript ausführen. Ich muss nur die HTTP-Anforderungen reproduzieren, die öffentlich sind, damit jeder sie sehen kann und wie sie funktionieren. Sie sind sogar von Google selbst ziemlich gut öffentlich dokumentiert.

Angenommen, ich bin ein Spammer-Idiot. Ich möchte, dass die Leute meine Spam-Site sehen. Also was mache ich? Ich schreibe ein kleines Stück Code, um Tausende und Abertausende dieser gefälschten Anfragen an GA zu senden, und gehe einfach alle UA-Nummern nacheinander nach dem Zufallsprinzip durch. Ich sende einen gefälschten Besuch mit einem gefälschten Referrer und meinem Spam-Domainnamen. Und rate was? Es wird in Ihren Google Analytics-Bildschirmen angezeigt.

Sie sehen diesen Spam wie jeden anderen normalen Besuch. Für GA war es ein normaler Besuch. Sie zeichnen nur die HTTP-Anforderungen auf, die normalerweise aus dem GA-Javascript-Code stammen. Aber eine Anfrage ist eine Anfrage, und es ist sehr, sehr einfach, eine falsche Anfrage zu stellen.

Das ist was los ist. Alles, was ich brauche, ist Ihre UA-Nummer, und mit ein wenig Aufwand kann ich einen Besuch auf Ihrer Website vortäuschen, ohne jemals eine Verbindung zu Ihrer Website herzustellen. Dieser gefälschte Besuch kann jeden Domainnamen und jeden Referrer enthalten, den ich wähle.

Hierbei handelt es sich um einen Angriff auf Google Analytics, um für die angezeigte Website zu werben. Sie können es auf Ihrem Server nicht blockieren, da Ihr Server überhaupt nicht beteiligt ist.

Sie können zwei Dinge tun: Erstens: Richten Sie einen Filter ein, wie John Conde vorschlägt. und zweitens, ob es eine Möglichkeit gibt, Google zu informieren. Dafür habe ich keine Antwort, aber ich habe eine Idee.

[Aktualisieren]

Dies beginnt empörende Ausmaße anzunehmen, angefangen von Hunderten von Spam-Treffern pro Tag bis hin zu vollständiger Werbung wie dieser:

Bildbeschreibung hier eingeben

closetnoc
quelle
2
@JohnMueller Das ist nicht in deinem Bereich, aber kannst du ein paar E-Mails verschicken, um zu sehen, ob G darüber Bescheid weiß? Danke im Voraus!!
Closetnoc
2
@ JohnConde Danke! John Mueller weiß vielleicht nichts davon, aber jemand in G sollte es wissen. Auch wenn es keine Antwort gibt, sollte G zumindest ein offenes Ohr haben, wenn dies nicht schon geschehen ist. Es ist das Richtige für uns alle. Prost!
Closetnoc
1
@ JohnConde BTW- Ich habe Fragen dazu auf anderen SE-Sites (und möglicherweise verwandten Sites) gesehen. Ich habe keine Notizen gemacht, aber gibt es eine gute Möglichkeit, eine Notiz an die anderen Mods zu senden? Oder soll ich einfach diese Domainnamen googeln und nach Antworten suchen und posten?
Closetnoc
1
@joelmdev Du hast den Punkt verpasst, dass diese nicht blockiert werden können. Dies ist ein direkter Angriff auf Google. Niemand außer Google hat die Kontrolle. Sie wurden benachrichtigt und diese haben größtenteils aufgehört.
closetnoc
2
@Steve Ich kann nicht sehen, dass es eine große Auszahlung gibt, es muss jedoch irgendwo eine geben. Die eine Person, die in der Antwort erwähnt wird, hasst Google und möchte wahrscheinlich zumindest Google in Verlegenheit bringen. Aber sie nutzen diesen Spam auch eindeutig, um den Verkehr zu verschiedenen Websites zu lenken, die weiterhin registriert sind. Ich habe sogar so etwas wie eine Anzeige mit dieser Methode gesehen. Es ist verdammt nervig !! Es tut unschuldigen Menschen mehr weh als Google. Ich gehe davon aus, dass es funktioniert ... sehr traurig.
closetnoc
5

Sie können sie ausschließen, indem Sie einen Filter erstellen . Sie müssen etwas Bestimmtes finden, damit Sie gute Besucher nicht versehentlich blockieren, und es ist mühsam, jeden Spammer manuell hinzuzufügen.

John Conde
quelle
Haben Sie einen IIS-Rat, der Ihnen helfen kann? Ich kann mit Apache helfen, aber das OP scheint IIS zu haben.
Closetnoc
2
Wenn sie nicht auf ihre Website kommen, was sie meiner Meinung nach gesagt haben, wäre dies keine wirksame Methode, um sie zu blockieren. Oder habe ich die Frage falsch gelesen?
John Conde
Ich habe es gelesen, da das OP Treffer mit Referrer-Spam bekommt.
Closetnoc
2
In der Tat, aber anscheinend treffen sie GA direkt, anstatt ihre Seite zu treffen. It seems these spammers are using scripts to spam directly to GA (i.e. they are not logged in my IIS).
John Conde
Okay. Du hast recht. Mein Fehler!! Ich bin mir nicht sicher, warum ich das nicht aufgegriffen habe, weil ich gerade vor dieser Frage etwas darüber gelesen habe. Ich werde auch von Referrer-Spam getroffen und in einem Artikel wurde (kurz) erwähnt, dass in den Protokolldateien keine Einträge vorhanden waren. Interessante neue Methode.
Closetnoc
4

Um Ihre Titelfrage direkt zu beantworten: "So bekämpfen Sie Referrer-Spammer", löschen Sie am einfachsten Google Analytics und wechseln Sie zu Piwik , das standardmäßig alle Referrer-Spam- Nachrichten automatisch blockiert .

Mir ist klar, dass Sie wahrscheinlich an Google Analytics gewöhnt sind und es weiterhin verwenden möchten, aber wenn Sie das Gesamtbild betrachten, haben Sie eine andere Option, die sehr gut funktioniert. Piwik kann auch so konfiguriert werden, dass Besucher-IP-Adressen protokolliert werden, wenn Sie möchten, und es gibt keine Besucherdaten an Drittanbieter weiter, die möglicherweise für einige Benutzer attraktiv sind.

Tom Brossman
quelle
2
Übrigens ist die von Piwik verwendete Referrer-Spam-Blacklist Open Source: github.com/piwik/referrer-spam-blacklist
Matthieu Napoli
Ihre Spam-Datenbank ist recht klein. Nicht einmal die in meinem Analysebericht angegebenen Domains.
Don Dilanga
1

Hier ist eine Regel, die auf IIS funktioniert:

<rewrite>
  <rules>
    <rule name="abort referer spam requests" stopProcessing="true">
      <match url=".*" />
      <conditions>
        <add input="{HTTP_REFERER}" pattern="(semalt\.com)|(buttons\-for\-website\.com)" />
      </conditions>
      <action type="AbortRequest" />
    </rule>
    <!--The rest of your rules, if you have any-->
  </rules>
</rewrite>
Flo
quelle
2
Diese Antwort hat nichts mit der Frage von OP zu tun, da Spammer Google Analytics direkt spammen und den Webserver von OP umgehen.
Alfred Myers
@AlfredMyers Ihr Kommentar ist teilweise richtig, da einige Spammer die Webserver-Methode verwenden, andere die direkte Methode, wie Sie bereits erwähnt haben. Im letzteren Fall besteht die einzige Lösung darin, Filter in Google Analytics hinzuzufügen, um eine saubere Berichterstellung zu erhalten. Um dies zu verhindern, würde Google es vorziehen, eine längere eindeutige ID für GA-Konten zu verwenden, damit Spammer verfügbare Nummern und Feuerabfragen nicht einfach durchlaufen können.
Flo
Das OP gibt ausdrücklich an, dass "... diese Spammer Skripte verwenden, um direkt an GA zu spammen (dh, sie sind nicht in meinem IIS angemeldet)." Für diese spezielle Frage greifen sie also nicht auf seinen Webserver zu.
Alfred Myers
1

Falls Sie immer noch nach einer Lösung suchen und die gemachten Verweise nicht verstehen, finden Sie hier den endgültigen Leitfaden zum Entfernen von Verweis-Spam, der seit dem 28. Dezember 2014 an 133. Stelle veröffentlicht wurde: http://www.analyticsedge.com/2014 / 12 / empfehlungs-spam-google-analytics entfernen /

TL; DR:

  • Ein gültiger Hostnamenfilter entfernt alle Ghost-Verweise (Hostnamen mydomain.com einschließen).

  • Durch einen bestimmten Ausschlussfilter (oder durch Sperren von Websites) wird die viel kürzere Liste der Spam-Crawler (semalt.com | kambasoft.com | 7makemoneyonline.com | best-seo-offer.com | best-seo-solution.com | buttons-for) entfernt -website.com | buttons-for-your-website.com | -musicas * -gratis | anticrawler.org | savetubevideo.com | ranksonic)

  • Ein erweitertes Segment kann verwendet werden, um sie aus Ihren Verlaufsberichten zu entfernen.

Das erweiterte Segment kann aus der Google Analytics-Lösungsgalerie importiert werden: https://www.google.com/analytics/gallery/#posts/search/%3F_.sort%3DDATE%26_.start%3D0%26_.type%3DADVANCED_SEGMENT % 26_.viewId% 3DGjpPQhFgS9aVzniXH4MTIg /

Mike Sullivan
quelle
0

Anfang letzten Jahres wurde ich beauftragt, die bestmögliche Lösung für Google Analytics-Spam zu finden. Wie alle anderen habe ich die empfohlenen Ansätze ausprobiert, aber nichts schien so gut zu funktionieren. Als nächstes habe ich mich an Google Tag Manager gewandt, aber das schien auch nicht viel zu helfen. Frustriert und verärgert beschloss ich, das Google Analytics-Tracking-Skript neu zu erstellen und dabei Gegenmaßnahmen gegen die häufigsten und nervigsten Spam-Formen zu ergreifen.

Obwohl es nicht perfekt ist, habe ich nach ca. 1,5 Jahren des stetigen Aufbaus, Testens, Debuggens und Refactorings jetzt ein ziemlich zuverlässiges Google Analytics-Tracking-Skript, das sofort funktioniert und leicht anpassbar ist. Für diejenigen, die Metriken erfüllen wollen, funktioniert dies wie ein Zauber.

https://github.com/nickolasburr/intelligent-ga-tracking

nburr
quelle