Trauer, Pagerank von meiner Website zu stehlen?

8

Ich habe heute in meinen Google Webmaster-Tools nach meiner Website gesucht und doppelte Titel für die folgenden Seiten meiner Website angezeigt (kleine Auswahl von vielen in meinem Website-Index):

/?title=3_Misconceptions_Regarding_Traumatic_Human_brain_Injury365
/?title=3_or_more_Misguided_beliefs_Pertaining_to_Disturbing_Head_Incidents2902384
/?title=A_Listing_Of_Successful_Web_Marketing_Tips_For_EveryoneHelpful_Online_Marketing_Methods_For_Easy_Success
/?title=Adhere_to_This_kind_of_Online_marketing_Guidance_To_develop_Your_Business

Dies sind sicherlich keine Seiten, die ich erstellt habe!

Ich habe mir auch meine strukturierten Daten angesehen, die ich auf meiner Website erstellt habe, und ich kann dies sehen (kleines Beispiel von vielen):

Structured Data > __sid=11 (Markup: kualalumpur.yalwa.my)
Structured Data > __sid=7 (Markup: www.locanto.cn)

Nichts davon ist das Ergebnis von etwas, das ich getan habe. Es ist offensichtlich eine Art Trauer oder ausgefeilter Plan, Pagerank zu stehlen.

Gestern habe ich auf allen meinen Seiten PHP Automated 301 Redirects und Canonicals installiert, um dies zu festigen (dank der wunderbaren Hilfe von Stack Overflow-Leuten). Aber ich würde gerne mehr darüber verstehen und was ihr Ziel ist.

Amy Neville
quelle
1
Auch wenn Sie die Seitentitel nicht erstellt haben, sind diese Seiten etwas, das Sie erstellt haben? Erlauben Sie Leuten, Seiten auf Ihrer Site zu erstellen und so weiter? Erzählen Sie uns mehr über die betreffende Site, da es im Moment niemand erraten kann. Es könnte Malware sein, es könnte Ihr Content-Management-System sein, das mehrere URLs mit unterschiedlichen Titeln bereitstellt, es könnten Leute sein, die versuchen, Ihren Ruf zu schädigen (Zweifelhafter Verstand). Bitte bearbeiten Sie Ihre Frage und geben Sie uns eine bessere Vorstellung von der Website, die Sie betreiben. Mit den von mir erwähnten Schlüsselpunkten ist auch eine URL zu der betreffenden Website für solche Themen von großer Bedeutung.
Simon Hayter
Dies sind keine Seiten, die ich erstellt habe. Ich bemerkte jedoch, dass mit meinem Wiki eine Seite angegeben wurde, die nicht erstellte Seiten darstellt und kein 404-Fehler angezeigt wird
Amy Neville
Das strukturierte Datenmaterial ist total seltsam, obwohl ich einfach nicht verstehe, woher das überhaupt kommen kann.
Amy Neville
1
Hallo Amy, denke ich habe es geschafft und obwohl einige Nachforschungen angestellt sind, denke ich, dass ich eine Antwort für dich habe, obwohl es dir vielleicht nicht gefällt;)
Simon Hayter
1
Hallo, ich arbeite mit dem Google Webmaster Tools-Team zusammen. Dies war ein Problem auf unserer Seite, das nur das Tool zum Testen strukturierter Daten und das entsprechende Dashboard in den Webmaster-Tools betraf. Es hatte keinen Einfluss auf die Websuche, und dies wurde wahrscheinlich nicht wirklich auf Ihrer Website gefunden. Entschuldigung für die Verwirrung!
John Mueller

Antworten:

6

Einige Möglichkeiten, wie nicht vorhandene Seiten in den Google-Index gelangen

Es gibt drei Möglichkeiten, wie nicht vorhandene Seiten bei Google oder einer anderen Suchmaschine landen können. Diese sind:

  • Ihre Seiten verlinken auf diese Seiten. (Dies kann in einer Sitemap, einer Profilseite, einem Blog-Kommentar oder einem href-basierten Link sein ...) Ich habe zum Beispiel einige Plugins von WordPress gesehen, die solche Links enthalten, weil sie auf einer Site entwickelt und dann auf hochgeladen wurden Die Plugin-Bibliothek, aber der Entwickler hat ein Cache-Setup, das mit dem Plugin gefunden wurde.

  • Ein Backlink verweist auf diese Seiten.

  • Ich habe Google-Indexseiten und -Strings gesehen, die einfach nicht existieren, obwohl Ihre anscheinend Wörter enthalten, bei denen ich nicht sehe, wie Googlebot sie finden könnte.

Interne Links

Jetzt handelt es sich höchstwahrscheinlich um einen internen Link, da ich Ihre Titelseiten googelt habe und nur 3 Seiten gefunden habe, Pro Webmaster, eine andere Website, auf der diese und Ihre Website abgebildet sind. Es sieht also so aus, als hätte jemand diesen Link erstellt oder eine Anwendung / ein Plugin / eine Malware.

Untersuchen

Um auszuschließen, dass Ihre Benutzer, Sie selbst oder eine Anwendung diese Links erstellt haben, müssen Sie sich bei SQL (idealerweise PHPMyadmin) anmelden und nach den Zeichenfolgen suchen. Stellen Sie sicher, dass die Datenbank frei von diesen Seiten ist. Nehmen Sie dann an Sie erhalten keine Treffer, wenn es darum geht, Cache-Dateien und PHP-Dateien nach diesen Seiten zu durchsuchen. Wenn Sie nichts finden, ist es wahrscheinlich, weil jemand es auch mit Ihnen verlinkt hat, und jetzt ist es nicht bei Google, weil es entfernt wurde.

Das /?Umleiten des Strings kann schädlich sein, wenn jemand Sie herausholt

Jetzt kann ich sehen, dass Sie alle /?title=Zeichenfolgen entfernt und auf die Startseite umgeleitet haben. Dies ist zwar in Ordnung, kann aber gleichzeitig auch schädlich sein, und ich werde es erklären.

Wenn jemand Ihre Website mit bösen Backlinks spammt, können Sie sie am schlechtesten auf die Startseite umleiten, da Google dies möglicherweise als Manipulation des Pageranks ansieht. Dies liegt daran, dass 301 den Saftfluss vom externen Link umleitet. Wenn es sich bei diesen Links um eine Viagra-Website handelt, geben Sie Google bei der Weiterleitung einen falschen Hinweis und dies kann zurückkommen und Sie beißen.

Ich muss die guten alten 404 lieben

Das Richtige für Seiten, die es einfach nicht gibt, ist die Verwendung eines 404. Diese sind völlig normal und vermitteln Google auf keinen Fall den Eindruck, dass Ihre Website beschädigt ist. Nicht existierende Seiten werden niemals in den Google-Index aufgenommen, und jeder, der auf nicht existierende Seiten zurückverweist, sollte Ihrer Website keinen Schaden zufügen, wenn ein 404 zurückgegeben wird. Wie bereits erwähnt, kann ein 301 auf der Startseite "KÖNNTE" den Saft behalten.

Vor 1-2 Jahren würde ich sagen, dass die Umleitung von Zeichenfolgen die beste Methode war, aber seit Googles Panda- und Penguin-Updates habe ich Websites gesehen, die alle möglichen Versuche unternommen haben, den Online-Ruf zu schädigen (Panda, Penguin bestraft Websites für Spam-Backlinks, bezahlte Links und im Allgemeinen nicht relevante Links) Obwohl Google behauptet, dass es unmöglich ist, den Ruf anderer online zu schädigen, wirft es die Frage auf, ob dies zutrifft, warum so viele derzeit andere spammen und woher sie wissen, dass nicht der Webmaster versucht, ihre eigenen Rankings zu manipulieren ? Ein umstrittener Bereich, aber lassen Sie uns das zusammenfassen ... Ich glaube, ein 404 wird in dieser Situation am besten zu Ihnen passen.

Das Bearbeiten der Abfrage sollte direkt vorwärts erfolgen, anstatt umzuleiten, /damit die Zeichenfolge entfernt wird, und dann 301 to /404/.

Simon Hayter
quelle
Ich werde nicht abstimmen lassen, aber das ist eine großartige Antwort, danke
Amy Neville
Überhaupt kein Problem, jetzt erhalten Sie Glücksbringer auf all Ihren Werbetafeln;)
Simon Hayter
@SimonHayter Nimmt Google die HTTP-Antwort 404 auf und ignoriert den Seiteninhalt? Was halten Sie von einer 404-Seite, auf der ein Javascript auf die Homepage umleitet? Nur neugierig auf die Auswirkungen
Jonathan