Wir sehen einige Seiten, die in unserem vorhanden sind, sitemap.xml
aber aus unerklärlichen Gründen im öffentlichen Suchindex von Google fehlen.
Sie können /superuser//sitemap.xml nicht herunterladen. Wir schützen diese Datei, da in der Vergangenheit Probleme damit aufgetreten sind. Googlebot kann dies jedoch. Wir haben über die Google Webmaster-Tools überprüft, dass die sitemap.xml
Datei heute heruntergeladen wurde und ohne Fehler als OK eingestuft wurde (grünes Häkchen).
Die sitemap.xml
enthält eine Liste der letzten 50.000 Fragen auf unserer Website, die gestellt wurden. Zum Beispiel diese Frage ...
/superuser/201610/how-to-see-the-end-of-long-chain-of-symbolic-links
... existiert in der sitemap.xml
als ...
<url>
<loc>/superuser/201610/how-to-see-the-end-of-a-long-chain-of-symbolic-links</loc>
<lastmod>2010-10-20</lastmod>
<changefreq>daily</changefreq>
<priority>0.2</priority>
</url>
Die Suche nach "Wie man das Ende einer langen Kette symbolischer Verknüpfungen erkennt" führt nur zu einem Ergebnis für questionhub.com, das unsere Daten kratzt (ein ganz anderes Problem).
Sie können die Anzahl der Fragen erhöhen und eine genaue Suche nach dem Fragentitel durchführen. Dieses Muster bleibt erhalten.
Diese URLs befinden sich in sitemap.xml, werden jedoch nicht im Google-Index angezeigt. Sie werden jedoch auf Websites angezeigt, die unsere Creative-Commons-Daten stören. Warum sollte das so sein?
Antworten:
Es sieht so aus, als ob Google diese Woche einige technische Crawling-Probleme hatte, die sich bemerkenswert ähnlich anhören wie das, was wir erlebt haben:
http://searchengineland.com/is-google-broken-sites-big-small-seeing-indexing-problems-53701
quelle
Google bietet oder garantiert nicht, dass Seiten in einer Sitemap indexiert werden.
Ich habe die Erfahrung gemacht, dass eine Seite verlinkt werden muss (von einer Seite einer Behörde), um angezeigt zu werden. Ist diese Seite / Frage direkt / indirekt von einer Seite mit einer Berechtigung verlinkt?
Wenn beispielsweise die Homepage von superuser.com (die vermutlich viele Inlinks enthält) direkt mit dieser Frage oder indirekt über eine Reihe anderer Seiten verknüpft ist, können Sie damit rechnen, dass sie indexiert wird.
Von Google:
http://www.google.com/support/webmasters/bin/answer.py?hl=de&answer=156184
quelle
Ich denke, Google könnte es schwer haben, Ihre Webseiten zu indizieren, 50.000 sind eine Menge. Mein Vorschlag wäre also, Ihre Sitemap in solche Teile aufzuteilen
Wenn Sie eine Panne haben, haben Sie ein besseres Glück, wenn diese 50.000 URLs indiziert werden.
Sitemaps.org Erklärung des Problems
http://sitemaps.org/protocol.php
quelle
Es scheint , dass Google die besagt , dass 46.514 eingereichten Links sind im Index. Könnte es ein Problem mit (ich hasse es zu sagen) aber Seitenrang sein? Die Scraping-Sites erledigen möglicherweise eine bessere Vernetzung usw. und werden höher eingestuft. Nur ein Gedanke.
Diese Suchseite : superuser.com Wie man das Ende einer langen Kette symbolischer Links sieht, scheint auch Ihre sitemap.xml korrekt abzurufen, obwohl nicht die erwarteten Ergebnisse zurückgegeben werden.
quelle
Bei dieser Art von Dingen gibt es viele mögliche Antworten.
Ich frage zunächst, wie viele Seiten Sie tatsächlich haben. (Sie haben 50.000 URLs auf einer schnellen Website eingereicht: superuser.com zeigt 125.000 indizierte URLs an. Glauben Sie, dass Sie nur 50.000 URLs haben und alle einreichen? Google findet 2-3 Exemplare jeder Seite? Oder Sie haben 1-Meilen-URLs und nur 12,5 % werden indiziert) Wenn Sie den Überblick behalten, können Sie festlegen, wo nach Problemen gesucht werden soll.
Wenn mit Schritt eins nichts falsch zu sein scheint, würde ich auf den Inhalt übergehen. Es sieht so aus, als ob QH viel mehr Inhalt auf seiner Seite hat und viele andere "Ressourcen" verlinken würde, obwohl der gesamte Inhalt von Google als verschrottet eingestuft wurde Seite nützlicher, da sie dem Benutzer mehr Ressourcen / Informationen bieten. Wenn sie als Autorität angesehen werden und Ihr gesamter Inhalt mit dem Ihren übereinstimmt, indiziert Google Ihren möglicherweise nicht, obwohl Sie das Original sind.
Wenn Sie davon überzeugt sind, dass dies nicht das Problem ist, erstellen Sie einige hochwertige Links dazu, bloggen Sie diese Frage in einigen beliebten Mitarbeiterblogs oder bitten Sie einige Freunde, darüber zu bloggen Fallstudie darüber usw.
Wenn Sie eine Menge starker Links erhalten und diese immer noch nicht indiziert werden, suchen Sie nach Gründen, die möglicherweise bestraft werden (in den meisten Fällen ist dies nicht das Problem, aber es tut nie weh, dies zu überprüfen).
Wenn nichts davon funktioniert, ist es ein einfaches technisches Problem, das übersehen wurde (Ausschluss von Robotern oder ähnliches).
Wenn Sie danach immer noch keine Antwort haben, fragen Sie Google und hoffen, dass Sie eine Antwort erhalten.
quelle
Die Frage wurde erst gestern gestellt - gib googlebot eine Chance, du bist nicht die einzige Seite im Internet, die er crawlen muss, weißt du :)
Wenn Fragen normalerweise innerhalb eines Tages oder so indexiert werden und eine Woche vergeht und diese noch immer nicht indexiert ist, könnte ich besorgt sein. Aber schon gar nicht nach 1 Tag.
quelle