Eine andere Website wird gespiegelt und steht in den Suchergebnissen über meiner Website

55

Es gibt eine unrühmliche Website namens "Thedirty", die meine Website vollständig gespiegelt hat und nun mit meinen Inhalten Links auf Google an der ersten Stelle aufweist. Ich habe meine Protokolldateien überprüft und festgestellt, dass diese Site meine seit einiger Zeit gecrawlt hat und auch 10.000 Links von ihrer Site zu meiner Site enthält.

Ich habe den Zugriff von Nutzern, die von dieser Website verwiesen werden, gesperrt und sie bereits als Web-Spam an Google gemeldet. Ich habe auch die Domain abgelehnt.

Wie bekommen sie Top-Links in Google (und überholen sogar meine) für solch schändliche Taktiken? Was sind die Schritte, um ein solches Problem vollständig zu beseitigen?

UPDATE 28.08.2014:

Ich dachte, ich würde ein Update dazu bereitstellen, da ich jetzt mehr Informationen habe. Also verwiesen dreißig ihre Subdomains auf meine IP, was dazu führte, dass ihre Subdomains wie meine Website aussahen.

Für ein paar Tage spielte dies keine Rolle, da ich mit htaccess alle HOSTS, die nicht zu meiner Domain gehören, zurück zu meiner Domain weitergeleitet habe. Nach ein paar Tagen haben dreißig ihre Subdomains geändert, um auf ihre Website zu verweisen, sodass ich nicht mehr davon profitiere.

Der springende Punkt ist also, dass sie meine Inhalte dazu verwendet haben, bei Google an die Spitze zu kommen, und diese Links nun wieder auf ihre Website verweisen, um mehr Besucher auf ihre Website zu lenken.

Es ist eine schmutzige Taktik von einer schmutzigen Website. Ich hoffe, dass Google ein solches Verhalten bestraft.

Marlboro Goodluck
quelle
3
Ich habe den Teil herausgeschnitten, in dem Sie ihr Motiv in Frage stellen, da dies hier nicht zum Thema gehört. Aber gute Frage ansonsten.
John Conde
1
Das Klonen von Websites scheint ein neuer Trick zu sein, viele Websites werden derzeit missbraucht. Zu diesem Thema gibt es Neuigkeiten bei Heise . Die übliche Lösung (abgesehen vom Melden der gefälschten Site) scheint darin zu bestehen, spezielle Inhalte an die IP-Adressen der Crawler zu senden, damit diese beispielsweise einen Link zu Ihrer realen Site anzeigen.
Martinstöckli
1
Eine weitere Sorge für die Zukunft ist, dass Konkurrenten absichtlich meine Inhalte auf Websites mit schlechtem Ruf veröffentlichen, um meinem Ruf zu schaden. Oder veröffentlichen spammy aussehende Blogs, die ohne mein Wissen auf meine Website verweisen.
Marlboro Goodluck
3
@Jarrod Roberson: Eigentlich weiß niemand etwas über einen Rechtsstreit, aber wie viele technische Lösungen ?!
Machineaddict
1
@JarrodRoberson Es handelt sich jedoch um ein Problem, mit dem ausschließlich Webmaster konfrontiert sind, und das daher für diese Website sehr aktuell ist, da die Frage hier Antworten von Personen erhält, die sich ebenfalls damit befassen mussten. Es sieht auch so aus, als hätten die Leute neben den rechtlichen auch mehrere technische Lösungen vorgelegt.
Bis zum

Antworten:

45

Wenn Sie Ihre Website nur spiegeln, indem Sie Ihre Website über ein Proxy-Skript einspeisen oder Ihr HTML-Verbatum erneut aufstoßen, können Sie Ihren Seiten kanonische URLs hinzufügen . Dadurch wird Google darüber informiert, dass es sich bei Ihrem Content um die ursprüngliche Quelle handelt, und Ihre URL wird in den Suchergebnissen und nicht in den Suchergebnissen angezeigt.

Senden Sie eine DMCA-Anfrage an Google. Sie sind ein bisschen langsam mit ihnen, aber letztendlich werden sie diese Seiten aus ihrem Index entfernen.

Das Deaktivieren der Links ist ein kluger Schachzug.

Ich weiß nicht, ob das Blockieren der Benutzer hilfreich ist. Vielleicht möchten Sie eine Nachricht oben auf Ihren Seiten platzieren, damit sie wissen, dass Sie die ursprüngliche Website sind, und die andere, dass ein Betrug möglicherweise eine bessere Lösung darstellt.

John Conde
quelle
2
Canonical URLs helfen nicht immer. Das Skript, das meine Site gespiegelt hat, hat die kanonischen URLs so geändert, dass sie ebenfalls auf die gefälschte Site verweisen. so war es sinnlos.
CaptainCodeman
28

Sie können eine DMCA-Beschwerde einreichen, und wenn Sie sich in den USA befinden, können Sie eine Zivilklage wegen Urheberrechts einreichen.

Hier ist ein Link zu einer kurzen Antwort, die erklärt, wie die DMCA-Beschwerde jedem helfen kann:

Müssen Sie in den USA sein, um eine DMCA-Beschwerde einzureichen?

... und ein anderer erklärt mehr ...

Wie viel von Ihrem Inhalt muss kopiert werden, bevor Sie eine DMCA-Beschwerde einreichen können?

Wenn Sie in den USA sind, können Sie einen Anwalt beauftragen, der mit urheberrechtlichen Fragen vertraut ist, und ihm ein Unterlassungsschreiben zusenden. Geben Sie ihnen 10 Tage (echte Tage und keine Werktage, obwohl auch Werktage in Ordnung wären), um den Inhalt zu entfernen. Sie möchten Snapshots der betreffenden Site für Ihre Beweise und Snapshots Ihrer Site erfassen. Wenn Sie überprüfen, ob eine Seite entfernt wurde, überprüfen Sie die Site direkt und nicht die Suchergebnisse.

Wenn die Seite nicht innerhalb des festgelegten Zeitraums entfernt wurde, können Sie einen Zivilprozess einreichen, dessen Verteidigung mindestens 10.000 US-Dollar kostet und Sie kaum etwas kostet. Sie werden auf dem Fahrersitz sein. Es ist wahrscheinlich, dass eine Einigung für mindestens 10.000 USD und möglicherweise mehr erzielt werden kann. Sie können auch Ihre Kosten zurückerhalten. Es ist wichtig, eine kostenlose Option anzubieten, um das Problem zu beheben, daher das Unterlassungsschreiben. Danach steht es Ihnen frei, einen Fall ohne Verantwortung gegenüber dem Angeklagten einzureichen.

Ein weiterer Hinweis ist, dass Sie Schadensersatz nachweisen müssen, wenn Sie vor Gericht gehen. Der Verlust des Suchverkehrs ist ein Schaden. Hier werden Sie mit Ihrem Anwalt zusammenarbeiten, um Kennzahlen zu sammeln, die den Verlust des Datenverkehrs veranschaulichen, und Sie müssen den Wert dieses Datenverkehrs monetarisieren. Selbstverständlich können Sie hier auch bei einer Konversionsrate von 100% höhere Zahlen annehmen. Für alle Fälle würde ich heute und in Zukunft mithilfe von Google Analytics und Ihrer Protokolldateianalyse-Software Messdaten zum Datenverlust erfassen.

Bitte beachten Sie, dass die Einreichung eines Falls nicht schwierig oder sehr teuer ist, insbesondere im Vergleich zu den Schäden, die Sie jetzt und in Zukunft erleiden. Urheberrechtsverletzungen sind in letzter Zeit zurückgegangen, aber die wenigen, die das Urheberrecht verletzen, sind heutzutage viel kühner. Wir müssen diese Leute aufhalten, und der einzige wirkliche Weg besteht darin, einen Kostenfaktor in die Geschäftsstrategie einfließen zu lassen, der eine Urheberrechtsverletzung nicht rentabel macht.

closetnoc
quelle
2
Das gesamte Problem, dem Sie ausweichen, besteht darin, dass es praktisch unmöglich ist, herauszufinden, wer sich hinter der Site befindet. Ich meine, sie müssten Idioten sein, um es einfach zu machen, die Site auf eine tatsächliche Person zurückzuführen.
David Mulder
1
@ DavidMulder Kein Ausweichen. Ein Anwalt kann die Unternehmen für die benötigten Informationen vorladen. Sogar ein freundlicher Brief ist genug. Wenn die Informationen nicht zur Verfügung gestellt werden, kann der Anwalt eine gerichtliche Hinterlegung bei einem Richter mit einer Strafe für die Gefängnisstrafe verlangen, wenn er nicht erscheint, oder die angeforderten Informationen zur Verfügung stellen. In den USA gibt es kein Versteck vor dem Gesetz oder vor dem Anderen. Dies funktioniert bis auf wenige Ausnahmen international.
Closetnoc
@closetnoc: Das Unternehmen möchte die Informationen möglicherweise nicht frei zur Verfügung stellen oder kann dies auch nicht tun. Es ist nicht sicher, ob ein Gericht eine Vorladung ausstellt oder ob der Weg in seiner Zuständigkeit bleibt. Sie befinden sich möglicherweise in einem sehr kostspieligen und langwierigen Rechtsstreit mit einem Dritten, der möglicherweise nicht einmal den richtigen Namen des Täters kennt. Ihrer gründlichen Antwort nach sind Sie sich dieser Hindernisse zweifellos bewusst, aber ich muss mich auf die Seite von David Mulder stellen: Ich denke, Sie verstehen, wie schwierig es ist, die Website auf eine Person zurückzuführen.
Marcks Thomas
@closetnoc: Ja, außer der Hosting-Provider hat nicht die richtigen Informationen. Und die Zahlung erfolgte wahrscheinlich mit einer Prepaid-Kreditkarte oder einer anderen Prepaid-Karte, einer gestohlenen Kreditkarte, einem Bitcoin oder einem anderen nicht nachvollziehbaren Transaktionsmechanismus. Oh, und der Hosting-Anbieter ist vielleicht gar nicht erst in den USA. Es heißt Internet, ob es Ihnen gefällt oder nicht.
David Mulder
@ DavidMulder Ich weiß zu schätzen, was Sie sagen. Ich bin in der Sicherheitsbranche tätig, insbesondere im Bereich der Erforschung, wie man die Bösen findet. Sie sprechen hauptsächlich von Chinesisch, Russisch oder Polnisch. Dennoch gibt es Möglichkeiten, anhand von Mustern und dergleichen festzustellen, wer diese Menschen sind. Sie geben sich selbst weg. Das ist genau das, was ich tue. Das musst du ausprobieren. Sie können nicht einfach umdrehen. Ein guter Internet-Anwalt kennt Leute wie mich und weiß, wie man an Informationen kommt. Ein Thread ist alles was ich brauche und ich bekomme es normalerweise. Aber es kann eine echte Anstrengung sein. Aber das ist der schlimmste Fall.
Closetnoc
27

Sie können ihre IP (oder IPs) nachverfolgen und ganz andere Inhalte zum Spiegeln zurückgeben - ganz wie Sie möchten. Auf diese Weise erhalten Sie freien Platz für Werbung, und Sie können ihre hohe Position bei Google zu Ihrem Vorteil nutzen.

Ich habe dies einmal verwendet, um den Benutzern auf der gespiegelten Website einfach zu erklären, dass dies die falsche Domain ist. Sie können auch einen einfachen HTTP-Redirect-Header bereitstellen.

Igor R
quelle
8
Eigentlich finde ich das aus irgendeinem Grund ziemlich lustig. +1
Mehrdad
1
Sie werden wahrscheinlich keine HTTP-Header klonen, aber Sie können ihnen Javascript-Animationen und lustige Banner im Marquee-Stil schicken, die "Dies ist eine Abzocke" und gute alte animierte Gifs schreien: P
Florian Fida
kann auch Meta-Tags und Javascript-Weiterleitungen verwenden, einer der drei wird fast sicher funktionieren. In jedem Fall ist dies keine stabile Lösung und funktioniert nur, bis sie es herausfinden und anfangen, dagegen zu arbeiten. @Mehrdad, ich denke, es ist lustig, weil es hacky ist :)
Igor R
Es kam mir auch komisch vor, weil der Angreifer tatsächlich eine Sicherheitslücke für sich selbst öffnet, indem er das Opfer auf seinen (Angreifer-) Spielplatz lässt, auch wenn er es jederzeit stoppen kann. was den Angreifer ziemlich dumm aussehen lässt.
Igor R
Ihre hohe Position bei Google ersetzt die hohe Position der ursprünglichen Website, es handelt sich also nicht wirklich um "kostenlose Werbung".
CaptainCodeman
12

Ein bisschen zu spät für Sie, aber die beste Idee, um Ihre Website (in Zukunft) zu schützen, wäre folgende: https://www.youtube.com/watch?v=I3pNLB3Cq24 (defcon 21, Verteidigung durch Zahlen) wird den Inhalt sehen, aber Bots werden

  • wirf den Inhalt weg
  • kriechen im Kreis
  • aufhören zu arbeiten

andere mögliche Ideen - stellen Sie sicher, dass Ihre Benutzer nichts davon sehen:

  • Lassen Sie sie GB an Informationen speichern (während sich nur wenige KB auf Ihrem Server befinden)
  • Lassen Sie die Bots ihr eigenes Gedächtnis mit gefälschten Links überfluten
  • sende gefälschte Inhalte (100% Scheiße - du musst Zeug schreiben - wie "Obama schwanger", "Spider-Man 5 - nächster Sommer", ... damit deine Diebe es hosten können ...)
  • Sende gefälschte Dateien (wie 42.zip, wenn sie den kopierten Inhalt nicht überprüfen, werden ihre Benutzer Spaß haben -> AV-Tools werden zeigen, dass etwas nicht stimmt -> Benutzer werden p * ss * d ...)
  • Lass sie auf mehr Daten warten (Dateigröße = 1-10 MB und sende zufälliges cr * p mit 1 Byte / s oder weniger)

andere Ideen:

  • Links, die durch Javascript geschützt sind (alt, nicht mehr verwendbar? Wenn sie jedoch unverändert bleiben, werden die Benutzer (für eine Weile) an Sie gesendet.)
  • dynamischer Müll (verwenden Sie Kommentare oder unsichtbare Elemente, um die Bots dazu zu bringen, Inhalte herunterzuladen, die Benutzer nicht sehen können - gute Bots werden nicht darauf hereinfallen)
  • IP-Adressen blockieren, die zu viel / zu schnell / falsch heruntergeladen wurden (Bots verhalten sich nicht wie Menschen)
  • Verwenden Sie Javascript, um auf Ihren Server umzuleiten, wenn die Dateien nicht von Ihrem Server gehostet werden (keine Hilfe gegen Diebstahl, aber die Diebe müssen sie entfernen oder ihre Benutzer bleiben nicht auf ihrer Seite - Sie können sie in verschiedene Routinen einbinden (wie Entschlüsselung von Inhalten) ))
MurksVomOrk
quelle
Ich habe meinen eigenen Code, den ich noch optimieren muss, um Spinnen zu blockieren. Ich werde mich um Ihre Ideen kümmern, denn das ist der Typ, der ich bin! ;-) Tolle Tipps!
Closetnoc
4
Das Problem beim Blockieren von Spinnen und Bots ist, dass Sie wahrscheinlich nicht möchten, dass alle von ihnen blockiert werden. Googles ist zum Beispiel ziemlich wichtig, wenn Sie möchten, dass Leute Ihre Website finden können. (Und da Google Ihre Website im Cache hat, muss ein Webcrawler Ihre Website nicht unbedingt crawlen, um sie zu duplizieren.)
trlkly
Wenn Sie ihnen absichtlich etwas anderes geben möchten, bevorzuge ich die Antwort von Igor , es für Sie vorteilhaft zu machen (umleiten / sagen, dass es falsch ist / Host-Anzeigen), anstatt sich zu wehren.
OJFord
2

Dies wird als Google Proxy Hack bezeichnet und ist mir auch passiert.

Das wichtigste zuerst:

  • Senden Sie eine DMCA-Beschwerde an den Webhost. Verwenden Sie diesen Link , um eine korrekt geformte Beschwerde zu erstellen und diese an die Support- oder Missbrauchs-E-Mail des Hosts zu senden. Wenn sich der Host in den USA befindet, muss er die Site entfernen. Auch wenn sie nicht in den USA ansässig sind, können sie die Site trotzdem entfernen. (Das ist mir einmal passiert.)
  • Verwenden Sie das Google DMCA-Tool , um die Entfernung der gespiegelten URLs aus den Suchergebnissen anzufordern.
  • Verwenden Sie den Scraper-Bericht von Google , um den Fehler im Google-Algorithmus zu melden.

Grundsätzlich ist dies jedoch ein Fehlschlag von Google. Trotz allem, was sie über ein Ranking sagen, das auf "qualitativem Originalinhalt" basiert, ist dies ein absurd einfaches Gegenbeispiel, das ehrlich gesagt nur peinlich ist.

Wenn sich genügend Leute darüber beschweren, wird Google sich hoffentlich zusammenfinden und die 10 Codezeilen aufschreiben, die erforderlich sind, um zu überprüfen, ob eine Site eine exakte Spiegelung einer zuvor eingerichteten Site ist.

Beachten Sie außerdem, dass die Verwendung von kanonischen URLs in dieser Instanz nicht immer funktioniert. Viele dieser Proxy-Skripte ändern die kanonischen URLs so, dass sie auf die Spiegel-Site verweisen, wodurch sie unbrauchbar werden.

Bedenken Sie schließlich, dass sie möglicherweise auch Ihre Hauptseite mit Müll-Links überflutet haben, um Ihre Platzierungen zu beschädigen. (Das ist mir auch passiert.)

Wenn Sie etwas suchen und kreativ denken, gibt es einige Möglichkeiten, sich zu wehren. Ich halte es nicht für eine gute Idee, hier eine vollständige Liste zu veröffentlichen, da dies nur das Leben der Hacker erleichtert.

CaptainCodeman
quelle
1

Wie andere bereits erwähnt haben, ist die Einreichung einer DMCA-Beschwerde und einer Zivilrechtsklage möglicherweise die beste Option.

Für den neuen Inhalt, den Sie veröffentlichen, können Sie in Betracht ziehen, Sie über Aktualisierungen Ihrer Website in sozialen Medien (Twitter, Facebook usw.) zu informieren, sobald Sie Beiträge veröffentlichen. Der dort aufgezeichnete Zeitstempel kann ein angemessener Indikator sein, den Sie zuerst geschrieben haben, falls Sie dies beweisen müssen. Mit den Google Webmaster-Tools können Sie festlegen, dass Googlebot Ihre Website häufig crawlt . Unter der Annahme, dass beliebte Suchmaschinen Ihre Webseiten regelmäßig indizieren (verwenden Sie den Site-Betreiber site: example.com, um herauszufinden), kann das Datum in der zwischengespeicherten Kopie als grober Indikator dafür verwendet werden, wann der Inhalt veröffentlicht wurde.

Auch für den neuen Inhalt, den Sie veröffentlichen, können Sie Wasserzeichen in Bilder einbetten und Kommentare in JS-Dateien einfügen, die darauf hinweisen, dass Sie der ursprüngliche Eigentümer dieser Dateien sind.

mvark
quelle
Wenn ein Bot den Inhalt kopiert, könnte er einfach Autoreninformationen in die Seite einfügen, sodass der kopierte Inhalt so etwas wie "Dies wurde von Foo erstellt, alle Rechte vorbehalten" enthält, was einen wirklich klaren Fall ergibt (Sie könnten z. B. ausblenden) das in Akrostichon, aber da es ein Bot ist, funktioniert es in Klartext und stärkt Ihre Argumentation).
Ángel