Ich habe einige URLs und Dateien in der robots.txt-Datei aktualisiert, um URLs und Dateien aus den Google-Suchergebnissen zu blockieren, aber immer noch Dateien, die in den Suchergebnissen angezeigt werden. Gemäß einem Vorschlag von einer Site habe ich versucht, die robots.txt durch die folgenden Schritte zu aktualisieren.
- Geben Sie in den Google Webmaster-Tools Gesundheit -> Als Google abrufen -> die URL ein und klicken Sie auf die Schaltfläche Abrufen.
Es werden jedoch weiterhin Dateien in den Suchergebnissen angezeigt.
Hinweis: In den Google Webmaster-Tools wird das Download-Datum "Gesundheit -> Blockierte URLs -> robots.txt-Datei - zwei Daten zurückverfolgt."
quelle
robots.txt gibt nur an, wie Google Ihre Website crawlen soll oder nicht. Wie Mike sagte, dauert es lange, bis die Seiten aus dem Index entfernt sind, wenn Sie sich ausschließlich auf diesen Vektor verlassen.
Sie müssen also auch eine Entfernungsanforderung stellen, wenn dies schneller erfolgen soll und Google die Seiten aus dem Index entfernen soll. Wenn Sie sich in den Webmaster-Tools befinden, gehen Sie zu
Optimization > Remove URLs
und befolgen Sie die Anweisungen.quelle
Robots.txt kann nur eine Suchmaschine verhindern , kriecht , wird es nicht die Indizierung verhindern , wenn die Seite oder Datei - Links von Seiten, intern oder extern auf Ihrer Website hat, die gecrawlt werden kann .
Um absolut sicher zu sein, dass eine Seite nicht indiziert wird, bewerben Sie sich
<meta name="robots" content="noindex">
. Verwenden Sie für Nicht-HTML-Inhalte wie Bilder von PDFs den entsprechenden HTTP-Header :X-Robots-Tag: noindex
.Wenn Sie diese Methoden verwenden, müssen Sie keine Anfragen an Google senden, um sie für Sie zu entfernen.
Weitere Diskussion über beide von Google hier .
quelle
Möglicherweise befindet sich dieser Link in der indizierten Datenbank von Google. Machen Sie sich keine Sorgen, wenn es aus der Google-Datenbank entfernt wurde und nicht in SERPs angezeigt wird.
quelle