Was fügt meinen URLs Froschzeichen hinzu?

8

Beim Durchsuchen des Abschnitts "Crawling-Fehler" der Google Webmaster-Tools habe ich eine Reihe sehr seltsamer 500 Fehler in Bezug auf meine Website entdeckt:

Froggy URLs

Ich konnte herausfinden, was diese Zeichen sind, und anscheinend sind es die ersten beiden Zeichen im Unicode-Bereich für den privaten Gebrauch . Meine Schrift hat sie zufällig einem Frosch zugeordnet, der eine winzige Krone und ein Symbol trägt, das der Ziffer 7 ähnelt.

Diese Symbole erscheinen nur auf den Adressen von Nicht-HTML-Dateien. Office-Dokumente, PDFs usw. - aber sie erscheinen nicht nur im Dateinamen.

Woher kommen diese Symbole und kann ich sie auf irgendeine Weise entfernen, damit Google meine Website ordnungsgemäß crawlen kann?

Einige Hintergrundinformationen:

  • Verwenden eines Webservers unter WS2K3 mit IIS6 und PHP 5.3.8
  • Die Site-Codierung ist UTF-8
  • Diese Symbole werden weder auf der Seite noch in der Quelle angezeigt
Jacob Hume
quelle
6
Jetzt gibt es etwas, das Sie nicht jeden Tag sehen.
John Conde
@ John Conde: Erzähl mir davon. Dies ist keine Ausgabe am Montagmorgen. : P
Jacob Hume
erscheinen sie in allen Nicht-HTML-Dateien oder nur in einigen?
Froderik
@froderik Nur eine Handvoll und die betroffenen Dokumente wurden von verschiedenen Entwicklern in verschiedenen Bereichen der Website veröffentlicht.
Jacob Hume

Antworten:

4

Es ist nur eine Vermutung, aber eine Möglichkeit ist, dass jemand anderes mit einem fehlerhaften Code einen Hotlink zu Ihren Dateien erstellt. Ich weiß, dass ich immer dann, wenn ich zweifelhafte Anfragen an meine Websites hatte, in der Lage war, diese auf den borked Link eines anderen zurückzuführen. (Es ist wirklich irritierend, dass Spinnen keine Http-Referer-Header enthalten, damit wir die Quelle dieser URLs leichter identifizieren können.)

Peter Taylor
quelle
1
"... Spinnen enthalten keine HTTP-Referer-Header ..." - Richtig, aber die Google Webmaster-Tools enthalten Berichte, in denen (normalerweise) aufgeführt ist, welche Websites mit dem betreffenden Inhalt verknüpft sind.
Danlefree
Ich habe sowohl den Abschnitt "Links zu Ihrer Website" als auch den Abschnitt "Interne Links" der Webmaster-Tools kurz überprüft und keine der Zeichen in den 1.000 angezeigten Links gesehen. Tolle Idee!
Jacob Hume