Mein WordPress-Blog ist vollständig geklont. Diese Klonseite wird in Echtzeit mit meinem Blog aktualisiert. Ich bin überrascht, dass jemand das tatsächlich kann.
Was kann ich tun, um schädliche Auswirkungen in meinem Suchmaschinenranking zu stoppen? Gibt es eine Möglichkeit, Google anzuweisen, diese Website nicht zu indizieren?
wordpress
scraper-sites
Tanvir Hasan
quelle
quelle
Antworten:
Sie laden Ihre Site einfach über ein serverseitiges Skript. Sie müssen lediglich die IP-Adresse des Servers über .htaccess blockieren. Öffnen Sie einfach die Zugriffsprotokolle Ihres Servers, öffnen Sie die geklonte Seite auf seiner Site, zeigen Sie Ihr Protokoll für den neuen Eintrag an und Sie erhalten dessen IP-Adresse.
Es würde auch nicht schaden, eine DMCA-Anfrage auch an Google zu senden, aber dies ist nicht wirklich notwendig, da dieser Inhalt sofort verschwindet, sobald Sie ihre IP-Adresse blockieren.
quelle
(Zusätzlich zu @ Johns Antwort.)
Eher neugierig , dass , während sie geklont zu haben scheinen alles (einschließlich Ihrer XML - Sitemaps * 1 ), sie haben die Datei robots.txt nicht geklont. Tatsächlich blockiert die robots.txt auf dieser Site aktiv das Crawlen von allem! In dieser Hinsicht scheint es also nichts zu tun zu geben. Wenn Sie eine Site-Suche in dieser Domain durchführen, wird nur die nackte Domain und ein Hinweis zurückgegeben, der besagt, dass sie von robots.txt blockiert wird.
(Eher neugierig, was ihre Absicht dabei sein würde? Sie könnten vielleicht einfach annehmen, dass sie einen Fehler mit robots.txt gemacht haben - und das vielleicht auch -, aber das sieht für mich eher nach einer absichtlichen Ausnahme aus?)
Während Ihre XML-Sitemaps geklont werden, aktualisieren sie die darin enthaltenen URLs nicht (wie auf den Hauptseiten der Website), sodass sie weiterhin auf Ihre Website verweisen.* 1 In Bezug auf die XML-Sitemap (s). Auf Ihrer Site ist "sitemap.xml" tatsächlich eine Weiterleitung zu "sitemap_index.xml" und die geklonte Site hat tatsächlich die Weiterleitung geklont ... die zurück zu Ihrer Site weiterleitet! (Sicherlich ein Fehler von ihrer Seite.) "Sitemap_index.xml" ist nur ein Index, der auf 4 andere Sitemaps verweist. Wenn eine dieser tatsächlichen Sitemaps direkt auf der geklonten Site angefordert wird, werden sie korrekt geklont und die URLs aktualisiert. Ich hätte jedoch gesagt, dass diese Sitemaps aufgrund der anfänglichen Weiterleitung von "sitemap.xml" wahrscheinlich nicht auf der geklonten Site gefunden werden. (?) Obwohl, wenn sie "sitemap_index.xml" direkt übermitteln würden, würde dies offensichtlich die Umleitung umgehen.
quelle
Wenn die Website Backlinks zu Ihnen erstellt, ist es wichtig, das Google Disavow-Tool zu verwenden, da sonst der Algorithmus unabhängig davon gegen Sie arbeitet.
https://www.google.com/webmasters/tools/disavow-links-main
Erstellen Sie eine TXT-Datei und fügen Sie Folgendes hinzu:
Laden Sie es dann über die Webmaster-Tools zu Google hoch.
Hier sind genau die Schritte, die ich unternehmen würde, um dieses Problem zu beheben. Ich weiß, dass viele Webmaster mit diesem Problem konfrontiert sind. Ich hatte dieses Problem schon einmal und es scheint (ironischerweise) keine eindeutige Antwort auf Google zu geben (weshalb ich helfen möchte). Matt Cutts ist der Typ, dem Sie über diese Themen zuhören sollten, aber ihm zuzuhören ist wie der Versuch, eine Schachpartie gegen einen Supercomputer in einem brennenden Haus zu gewinnen (keine Hilfe zu finden).
Die kurzen Schnitte:
Meine erste Antwort war, die Domain zu disavowieren, aber ich habe vergessen zu erwähnen, dass Sie disavowieren müssen:
(Google zählt sie als zwei separate Domains).
quelle