Als «robots.txt» getaggte Fragen

9
Müssen verhindern, dass Bots meinen Webserver töten

Ich habe EXTREME Bot-Probleme auf einigen meiner Websites in meinem Hosting-Konto. Die Bots nutzen über 98% meiner CPU-Ressourcen und 99% meiner Bandbreite für mein gesamtes Hosting-Konto. Diese Bots generieren mehr als 1 GB Datenverkehr pro Stunde für meine Websites. Der tatsächliche menschliche...

8
Robots.txt für mehrere Domains mit derselben Website

Ich habe die folgenden drei Domänen: example1.com (Nicht verbieten) example2.com (Nicht verbieten) example3.com (ermöglichen) Alle Domains verweisen auf denselben Ordner public_html. Wie kann ich verhindern, dass Suchmaschinen Seiten in den ersten beiden Domains

8
Wie gehe ich in robots.txt mit Zulassen und Nicht zulassen um?

Ich verwende einen ziemlich großen Webcrawler. Wir sind sehr bemüht, den Crawler innerhalb der akzeptierten Community-Standards zu betreiben, und dazu gehört auch die Einhaltung von robots.txt. Wir bekommen nur sehr wenige Beschwerden über den Crawler, aber wenn wir das tun, geht es hauptsächlich...

7
robots.txt nicht aktualisiert

Ich habe einige URLs und Dateien in der robots.txt-Datei aktualisiert, um URLs und Dateien aus den Google-Suchergebnissen zu blockieren, aber immer noch Dateien, die in den Suchergebnissen angezeigt werden. Gemäß einem Vorschlag von einer Site habe ich versucht, die robots.txt durch die folgenden...