Ich verwende Github, um den Text einer meiner Websites zu speichern, aber das Problem ist, dass Google den Text auch in Github indiziert. Der gleiche Text wird also sowohl auf meiner Website als auch auf Github angezeigt. zB diese Suche Der Top-Hit ist meine Seite. Der zweite Treffer ist das Github-Repository.
Es macht mir nichts aus, wenn die Leute die Quellen sehen, aber ich möchte nicht, dass Google sie indiziert (und möglicherweise für doppelte Inhalte bestraft). Gibt es eine Möglichkeit, außer dem privaten Repository Google anzuweisen, die Indizierung zu beenden?
Was passiert bei Github Pages ? Dies sind Sites, an denen sich die Quelle in einem Github-Repository befindet. Haben sie das gleiche Problem der Vervielfältigung?
Nehmen Sie diese Suche, die am häufigsten getroffenen führt zur Marpa-Site, aber ich sehe die Quelle nicht im Suchergebnis. Wie?
quelle
Antworten:
Die Datei https://github.com/robots.txt von GitHub ermöglicht die Indizierung der Blobs im 'Master'-Zweig, schränkt jedoch alle anderen Zweige ein. Wenn Sie also keinen Hauptzweig haben, sollte Google Ihre Seiten nicht indizieren.
So entfernen Sie den 'Master'-Zweig:
Erstellen Sie in Ihrem Klon einen neuen Zweig - nennen Sie ihn "main" und senden Sie ihn an GitHub
Ändern Sie auf GitHub den Standardzweig (siehe Abschnitt Einstellungen Ihres Repositorys) oder hier https://github.com/blog/421-pick-your-default-branch
Entfernen Sie dann den Hauptzweig von Ihrem Klon und von GitHub:
Lassen Sie andere Personen, die Ihr Repository möglicherweise bereits gespalten haben, dasselbe tun.
Wenn Sie GitHub finanziell unterstützen möchten, können Sie auch privat https://help.github.com/articles/making-a-public-repository-private verwenden
quelle
username.github.io
Repository wird bereitgestellt, wenn es sich in einemmaster
Zweig befindet. Projekt-Repositorys wieusername;github.io/project-one
werden basierend auf dergh-pages
Branche bereitgestellt. Siehe help.github.com/articles/user-organization-and-project-pagesWenn Sie sich an die Hauptniederlassung halten möchten, scheint es keinen Weg zu geben, ein privates Repo (und das Upselling Ihres GitHub-Kontos) oder einen anderen Dienst zu verwenden, der private Repos wie Bitbucket kostenlos anbietet .
quelle
einfache Antwort: Machen Sie Ihr Repo privat.
https://help.github.com/articles/making-a-public-repository-private
quelle
Kurze Markise. Ja, das kannst du mit robots.txt.
Wenn Sie verhindern möchten, dass Googlebot Inhalte auf Ihrer Website crawlt, haben Sie eine Reihe von Optionen, darunter die Verwendung von robots.txt, um den Zugriff auf Dateien und Verzeichnisse auf Ihrem Server zu blockieren.
Sie benötigen eine robots.txt-Datei nur, wenn Ihre Website Inhalte enthält, die von Suchmaschinen nicht indiziert werden sollen. Wenn Suchmaschinen alles auf Ihrer Website indizieren sollen, benötigen Sie keine robots.txt-Datei (nicht einmal eine leere).
Während Google den Inhalt von Seiten, die von robots.txt blockiert werden, nicht crawlt oder indiziert, können wir die URLs dennoch indizieren, wenn wir sie auf anderen Seiten im Web finden. Infolgedessen können die URL der Seite und möglicherweise andere öffentlich verfügbare Informationen wie Ankertext in Links zur Website oder der Titel aus dem Open Directory-Projekt (www.dmoz.org) in den Google-Suchergebnissen angezeigt werden.
Quellen:
http://support.google.com/webmasters/bin/answer.py?hl=de&answer=93708 http://support.google.com/webmasters/bin/answer.py?hl=de&answer=156449
quelle
master
.master
Kann für Projekt-Repositorys gelöscht und ein anderer Zweig für GitHub-Seiten verwendet werden. Nichts davon gilt für OP, da Szabgab sagt, dass er keine Github-Seiten verwendet.