Ich habe heute in meinen Google Webmaster-Tools nach meiner Website gesucht und doppelte Titel für die folgenden Seiten meiner Website angezeigt (kleine Auswahl von vielen in meinem Website-Index):
/?title=3_Misconceptions_Regarding_Traumatic_Human_brain_Injury365
/?title=3_or_more_Misguided_beliefs_Pertaining_to_Disturbing_Head_Incidents2902384
/?title=A_Listing_Of_Successful_Web_Marketing_Tips_For_EveryoneHelpful_Online_Marketing_Methods_For_Easy_Success
/?title=Adhere_to_This_kind_of_Online_marketing_Guidance_To_develop_Your_Business
Dies sind sicherlich keine Seiten, die ich erstellt habe!
Ich habe mir auch meine strukturierten Daten angesehen, die ich auf meiner Website erstellt habe, und ich kann dies sehen (kleines Beispiel von vielen):
Structured Data > __sid=11 (Markup: kualalumpur.yalwa.my)
Structured Data > __sid=7 (Markup: www.locanto.cn)
Nichts davon ist das Ergebnis von etwas, das ich getan habe. Es ist offensichtlich eine Art Trauer oder ausgefeilter Plan, Pagerank zu stehlen.
Gestern habe ich auf allen meinen Seiten PHP Automated 301 Redirects und Canonicals installiert, um dies zu festigen (dank der wunderbaren Hilfe von Stack Overflow-Leuten). Aber ich würde gerne mehr darüber verstehen und was ihr Ziel ist.
Antworten:
Einige Möglichkeiten, wie nicht vorhandene Seiten in den Google-Index gelangen
Es gibt drei Möglichkeiten, wie nicht vorhandene Seiten bei Google oder einer anderen Suchmaschine landen können. Diese sind:
Ihre Seiten verlinken auf diese Seiten. (Dies kann in einer Sitemap, einer Profilseite, einem Blog-Kommentar oder einem href-basierten Link sein ...) Ich habe zum Beispiel einige Plugins von WordPress gesehen, die solche Links enthalten, weil sie auf einer Site entwickelt und dann auf hochgeladen wurden Die Plugin-Bibliothek, aber der Entwickler hat ein Cache-Setup, das mit dem Plugin gefunden wurde.
Ein Backlink verweist auf diese Seiten.
Ich habe Google-Indexseiten und -Strings gesehen, die einfach nicht existieren, obwohl Ihre anscheinend Wörter enthalten, bei denen ich nicht sehe, wie Googlebot sie finden könnte.
Interne Links
Jetzt handelt es sich höchstwahrscheinlich um einen internen Link, da ich Ihre Titelseiten googelt habe und nur 3 Seiten gefunden habe, Pro Webmaster, eine andere Website, auf der diese und Ihre Website abgebildet sind. Es sieht also so aus, als hätte jemand diesen Link erstellt oder eine Anwendung / ein Plugin / eine Malware.
Untersuchen
Um auszuschließen, dass Ihre Benutzer, Sie selbst oder eine Anwendung diese Links erstellt haben, müssen Sie sich bei SQL (idealerweise PHPMyadmin) anmelden und nach den Zeichenfolgen suchen. Stellen Sie sicher, dass die Datenbank frei von diesen Seiten ist. Nehmen Sie dann an Sie erhalten keine Treffer, wenn es darum geht, Cache-Dateien und PHP-Dateien nach diesen Seiten zu durchsuchen. Wenn Sie nichts finden, ist es wahrscheinlich, weil jemand es auch mit Ihnen verlinkt hat, und jetzt ist es nicht bei Google, weil es entfernt wurde.
Das
/?
Umleiten des Strings kann schädlich sein, wenn jemand Sie herausholtJetzt kann ich sehen, dass Sie alle
/?title=
Zeichenfolgen entfernt und auf die Startseite umgeleitet haben. Dies ist zwar in Ordnung, kann aber gleichzeitig auch schädlich sein, und ich werde es erklären.Wenn jemand Ihre Website mit bösen Backlinks spammt, können Sie sie am schlechtesten auf die Startseite umleiten, da Google dies möglicherweise als Manipulation des Pageranks ansieht. Dies liegt daran, dass 301 den Saftfluss vom externen Link umleitet. Wenn es sich bei diesen Links um eine Viagra-Website handelt, geben Sie Google bei der Weiterleitung einen falschen Hinweis und dies kann zurückkommen und Sie beißen.
Ich muss die guten alten 404 lieben
Das Richtige für Seiten, die es einfach nicht gibt, ist die Verwendung eines 404. Diese sind völlig normal und vermitteln Google auf keinen Fall den Eindruck, dass Ihre Website beschädigt ist. Nicht existierende Seiten werden niemals in den Google-Index aufgenommen, und jeder, der auf nicht existierende Seiten zurückverweist, sollte Ihrer Website keinen Schaden zufügen, wenn ein 404 zurückgegeben wird. Wie bereits erwähnt, kann ein 301 auf der Startseite "KÖNNTE" den Saft behalten.
Vor 1-2 Jahren würde ich sagen, dass die Umleitung von Zeichenfolgen die beste Methode war, aber seit Googles Panda- und Penguin-Updates habe ich Websites gesehen, die alle möglichen Versuche unternommen haben, den Online-Ruf zu schädigen (Panda, Penguin bestraft Websites für Spam-Backlinks, bezahlte Links und im Allgemeinen nicht relevante Links) Obwohl Google behauptet, dass es unmöglich ist, den Ruf anderer online zu schädigen, wirft es die Frage auf, ob dies zutrifft, warum so viele derzeit andere spammen und woher sie wissen, dass nicht der Webmaster versucht, ihre eigenen Rankings zu manipulieren ? Ein umstrittener Bereich, aber lassen Sie uns das zusammenfassen ... Ich glaube, ein 404 wird in dieser Situation am besten zu Ihnen passen.
Das Bearbeiten der Abfrage sollte direkt vorwärts erfolgen, anstatt umzuleiten,
/
damit die Zeichenfolge entfernt wird, und dann 301 to/404/
.quelle