Weiß jemand, wie Google oder Yahoo bei sehr großen Datenmengen nach Stichwörtern suchen? Welche Art von Datenbank oder Technologien setzen sie dafür ein?
Es dauert nur wenige Millisekunden, aber es werden mehr als eine Milliarde Seiten indiziert.
database-design
full-text-search
rkosegi
quelle
quelle
Antworten:
Ich bin sicher, dass es eine Kombination von Dingen gibt:
viele davon - Daten werden über viele Knoten und verschiedene Rechenzentren verteilt und repliziert
quelle
Tauben .
Das Herzstück von Googles Suchtechnologie ist PigeonRank ™ , ein System zum Ranking von Webseiten, das von den Google-Gründern Larry Page und Sergey Brin von der Stanford University entwickelt wurde:
quelle
Es ist wichtig, ein paar Dinge über Google zu beachten:
Ihre Datenbank ist die proprietäre BigTable - sie wurde von GOOGLE speziell für ihre Anforderungen entwickelt
Die proprietäre Datenbank des Unternehmens basiert auf dem proprietären Dateisystem Google File System. Auch dieses wurde von GOOGLE entwickelt, um mit gängiger Standardhardware problemlos erweitert werden zu können. Wie Aaron in seiner Antwort erwähnt hat, haben sie eine große Anzahl von durchschnittlichen Servern anstelle einer kleinen Anzahl von sehr leistungsfähigen Servern.
Sie speichern einzelne Tabellen über mehrere Computer hinweg, um den Zugriff zu beschleunigen. Ihre Software weiß, welche Daten sich auf welchem Computer befinden, und statt eine Festplatte zu durchsuchen, um sie zu lokalisieren, kann sie direkt mit den relevanten Informationen zum Server geleitet werden.
quelle
Google verwendet keine traditionelle relationale Datenbanktechnologie. Es entwickelte seine eigene Technologie, große Tabelle und Karte zu reduzieren. Die Originalarbeiten sind hier: Big Table und Map / Reduce . Interessant ist auch die SSTable-Tabelle für sortierte Zeichenfolgen .
Ähnliche Technologien werden jetzt in Hadoop und in den NoSQL-Datenbanken verwendet .
quelle
Lesen Sie Steven Levys " In The Plex: Wie Google unser Leben denkt, funktioniert und gestaltet ". Dieses Buch ist eine faszinierende Lektüre über alles, was Google zu bieten hat, und behandelt auf hohem Niveau einige der Technologien und Techniken, die hinter der Suche stehen. Aaron fasst es in seiner Antwort sehr gut zusammen und Levys Buch wird Ihnen einige Details darüber geben, wie sie es tun.
quelle