Als «web-crawlers» getaggte Fragen

10
Pluszeichen vor URLs in Benutzeragenten

Ich habe einen kleinen Webcrawler ausgeführt und musste mich entscheiden, welchen Benutzeragenten ich dafür verwenden soll. Listen von Crawler-Agenten sowie Wikipedia schlagen das folgende Format vor: examplebot/1.2 (+http://www.example.com/bot.html) Einige Bots lassen jedoch das Pluszeichen vor...

9
Disqus-Thread-Migration. Fallstricke?

Ich habe eine Site auf eine neue Domain migriert. Die Seite selbst ist ziemlich unkompliziert (sie verwendet Jekyll) und alles ist gut gelaufen - außer der Migration von Disqus-Threads. Ich hatte teilweise Erfolg - einige der Threads wurden erfolgreich migriert, aber nicht alle. Ich habe den...

8
Welches Meta-Roboter-Tag wird bevorzugt?

Meine Frau arbeitet an einem Gymnasium in Deutschland. Ich habe kürzlich festgestellt, dass es extrem schwierig ist , die Homepage dieser Schule mit Google zu finden. Ich habe mir den Quellcode der Seite angesehen und glaube, ich habe den Grund gefunden: Es gibt zwei <meta name="robots">Tags;...

7
@ font-face, Google Fonts und SEO

Jemand, den ich kenne, behauptet, dass Suchmaschinen wie Google Probleme mit Schriftarten haben, die nicht die alten Standardschriftarten von gestern sind, was dazu führt, dass Seiten nicht von Suchspinnen analysiert werden. Um auf der sicheren Seite SEO zu sein, sollte ich mich an die Standbys...