Google behauptet, fair zu sein, und es liegt im Interesse des Unternehmens (meistens), das Internet nach allem und jedem abzusuchen, auf das seine Spinnen zugreifen können. Ich möchte gerne wissen:
- Welche Art von (öffentlich zugänglichen) Inhalten liefert Google nicht aus?
- Gibt es eine bestimmte Art von Inhalten, die Google nicht abrufen kann?
Verweise, insbesondere auf Googles eigene Dokumentation, wären besonders beeindruckend.
google-search
samthebrand
quelle
quelle
Antworten:
Ein paar Ideen zur Art der Dinge:
robots.txt
Datei einer Domain ausdrücklich nicht zugelassen werden , werden aus dem Google-Index ausgeschlossen.Erfahren Sie mehr über das Deep Web
quelle
Abgesehen von Twitter indiziert Google Tumblr nicht so gut. Blog-Posts auf Tumblr sind mit der Tumblr-Suche einfacher zu finden. Auch alles auf Google Sites ist nicht (oder kaum) indiziert. Wenn Sie eine Google-Site starten, besorgen Sie sich Ihre eigene Domain.
Kleinere Blogs, die nicht regelmäßig aktualisiert werden, werden häufig aus den Suchergebnissen entfernt. Plus alles, was sie denken, ist ein Splog .
quelle
Nun, die meisten Twitter-Inhalte werden von Google nicht indiziert, auch wenn sie öffentlich sind. Früher war es für Google verfügbar, aber das ist seit dem Ablauf der Vereinbarung nicht mehr der Fall.
Quelle .
quelle
Es hängt davon ab, in welchem Land Sie sich befinden. In Deutschland werden nicht Tausende von Websites angezeigt, die die Regierung für nicht gut hält, und die Liste wird jedes Jahr um Tausende erweitert.
Google ist der Motor der Internet-Zensur. Wenn Sie ein kostenloses Internet wünschen, nutzen Sie einige nicht böse Unternehmen wie DuckDuckGo oder andere.
quelle
Sie können in der Google-Suche nicht nach einem Schlüsselwort mit Sonderzeichen suchen :
Dies ist besonders ärgerlich, wenn Google Code verwendet.
quelle
Google entfernt Suchergebnisse, die nach dem Abbau von DMCA und ähnlichen Anfragen als Urheberrechte verletzend eingestuft werden. Siehe das Antragsformular für das Entfernen von Suchergebnissen bei Google (möglicherweise ist dort auch eine zusätzliche URL angegeben).
quelle
Websites mit so viel Inhalt, dass Google einfach nicht die Zeit (oder die Neigung) hatte, alles zu indizieren.
Websites, für die keine durchsuchbare Sitemap vorhanden ist und für die Google Suchbegriffe für den Zugriff auf die auf der Website verfügbaren Ergebnisse benötigt, werden möglicherweise nicht vollständig indiziert.
quelle