WordPress mit SOFT 404 in der Google Search Console (WMT) Was verursacht Q82019309.com?

8

Auf der Website meines Bruders , die ich für eine Weile für ihn entworfen habe, sind Hunderte von SOFT 404 in der Google Search Console, ehemals Webmaster Tools, gemeldet. Im Allgemeinen finde ich es einfach, Soft 404 zu reparieren, aber das hat mich ein wenig verblüfft. Alle weichen Fehler geben eine ungerade Zeichenfolge zurück, Q82019309.comdie gelegentlich einen Unterordner Aristocratin der Zeichenfolge enthält /?=.

Die 404 sehen im Allgemeinen ungefähr so ​​aus:

  • Codiert: /search/%E5%A4%A7%E5%A5%96%E6%80%BB%E4%BB%A3Q82019309.com
  • Entschlüsselt: /search/大奖总代Q82019309.com

Die von Informationen verlinkten Informationen bieten:

  • Codiert: /?s=%E5%A4%A7%E5%A5%96%E6%80%BB%E4%BB%A3Q82019309.com
  • Entschlüsselt: /?s=大奖总代Q82019309.com

Zuerst glaubte ich, dass dies ein isoliertes Problem war, aber als ich nachforschte, stellte ich fest, dass dieses Problem tatsächlich Tausende von Websites betrifft und jemand die Ursache kennen muss. Wenn ich Q82019309.com Google oder Aristocrat Q82019309.com google, bin ich überwältigt von der Menge der Ergebnisse, einschließlich einiger hoch angesehener Websites wie:

Fragen):

Also, was verursacht diese weichen 404-Fehler mit String Q82019309.commit oder ohne Aristocrat.

Simon Hayter
quelle
Ihre Website wurde gehackt. Q82019309.com ist kompromittiert.
Closetnoc
Wenn Sie auf die Website Q82019309.com gehen, heißt es, dass es sich um eine Angriffsseite handelt, und ich stimme zu, dass sie zweifelhaft ist, aber es fällt mir schwer zu glauben, dass all diese Websites mit etwas gehackt wurden, das bei der Suche eine Abfragezeichenfolge verwendet. Es gibt literarische Hunderttausende von Websites, die über Q82019309.com berichten ... hoch angesehene ... sicherlich sind diese nicht alle gehackt?
Simon Hayter
Die Links scheinen alle Spam zu sein. Ein sehr typisches Profil. Dies scheint auch spezifisch für WP-Sites zu sein. Dies scheint innerhalb weniger Tage (4 oder so) ziemlich neu zu sein. Überprüfen Sie die WP-Installation, um sicherzustellen, dass alles auf dem neuesten Stand ist. Siehe: web.nvd.nist.gov/view/vuln/...
closetnoc
Wurde vor über einer Woche als 13. entdeckt.
Simon Hayter
Ich denke, ich muss die Fehler- und Zugriffsprotokolle durchsehen, um festzustellen, ob jemand versucht hat oder über einen neuen Hack reingekommen ist.
Simon Hayter

Antworten:

2

Wir hatten das gleiche Problem bei wisepops.com seit dem 3. Januar 2017.

Google beschwert sich über Soft 404, auch wenn die Indizierung auf diesen Seiten deaktiviert ist. Die Wordpress-Suchseite enthält standardmäßig dieses Meta:

<meta name="robots" content="noindex,follow">

Ich habe beschlossen, Suchseiten ohne Ergebnisse einen 404-HTTP-Code zurückzugeben. Da sich die Suchabfrage in der URL befindet, ist es in Ordnung, sie auf diese Weise zu behandeln.

Für Wordpress habe ich am Ende der Datei functions.php hinzugefügt:

/*---------------------------------------------------*/
/*  SEARCH PAGES WITHOUT RESULTS SEND 404 HTTP CODE  */
/*---------------------------------------------------*/
function wisepops_search_404_code() {
    if (is_search() && !have_posts()) {
        header($_SERVER['SERVER_PROTOCOL'] . ' 404 Not Found');
        $GLOBALS['wp_query']->is_404 = true;
    }
}
add_action('get_header', 'wisepops_search_404_code');
Wisepops
quelle
@ wisepops.com: Ich habe das gleiche Problem mit diesem dummen Search-Spam-Angriff. Danke für den Code! Es hat super für mich funktioniert! Jetzt gibt die leere Suche einen sauberen 404 zurück und das ist cool. Mit freundlichen Grüßen Mitschu
Mitschu
Würde dies einen tatsächlichen Benutzer, der eine Suche durchführt und keine Ergebnisse erhält, auch auf eine 404-Seite senden?
Brandozz
1

Es sieht für mich so aus, als würde Ihr Etwas mit schlechten Suchanfragen mit Ihrer Website-Suchfunktion verknüpft. Diese Suchanfragen erhalten "keine Ergebnisse gefunden". Googlebot findet diese Links und Sie erlauben Googlebot, Ihre Website-Suche zu crawlen. Aufgrund der "keine Ergebnisse" erkennt Google sie als "soft 404".

Es ist ein großes Nein-Nein, wenn Google Ihre Website-Suchergebnisse crawlen lässt. Dadurch kann Ihre gesamte Website von Google bestraft werden. Siehe Matt Cutts: Suchergebnisse in Suchergebnissen . Sie sollten das Crawlen von Suchergebnissen mit robots.txt nicht zulassen :

Disallow: /search
Disallow: /?s=

Dann wird Googlebot diese URLs auch nicht crawlen und dort auch Fehler melden.

Stephen Ostermiller
quelle
Stephen, hat das die weichen 404er wieder geliebt? Ich habe dies tatsächlich zu meiner robots.txt hinzugefügt und alle meine weichen 404 auf der Suchseite als behoben markiert. Sobald ich dies überprüft habe, werde ich dies als korrekt markieren. Dies scheint jedoch die beste Lösung zu sein.
Brandozz