Warum sagt Google auf der ersten Seite, dass es Tausende von Ergebnissen gibt, auf der letzten Seite jedoch weniger als hundert?

11

Warum sagt Google auf der ersten Seite, dass es Tausende von Ergebnissen gibt, auf der letzten Seite jedoch weniger als hundert?

Das ist eine Art rekursive Google-Suche, die selbsterklärend sein sollte. Ich habe einige Zeit gebraucht, um den Satz zu optimieren und eine Zahl zu finden, die genau übereinstimmt. Deshalb habe ich ihn stattdessen in " Hunderte " geändert ! : P.

Wenn Sie Google lange genug verwendet haben, sind Sie sicherlich schon oft auf ähnliche Situationen gestoßen. Immer wenn weniger als 10 Seiten angezeigt werden, ist es recht einfach zu sehen. Der Punkt ist: Die Anzahl der Ergebnisse auf jeder Seite außer der letzten scheint eine schreckliche Schätzung zu sein .

Was noch seltsamer ist, manchmal wird die Schätzung plötzlich auf allen Seiten viel besser und fast genau gleich als auf der letzten Seite - der einzigen Seite, die immer korrekt ist.

Weiß jemand warum?

Cregox
quelle
1
Im Moment steht auf Seite eins für diese Suche 3200 Ergebnisse, aber auf der letzten Seite steht 75 (für Leute, die an einem Update interessiert sind)
dkuntz2
@DKuntz es sind 2990 und 65 für mich (während ich angemeldet bin), während wenn ich mich abmelde (wie ich es das erste Mal gemacht habe), es sich in 3120 und 77 verwandelt. Vielleicht werde ich später die Frage leicht ändern und bauen eine konsistentere rekursive Abfrage erstellen - aber jeder kann dies auch tun! : P
Cregox
Google ist komisch.
dkuntz2
Meins sagt immer 208 Ergebnisse auf der letzten Seite, egal ob es 4 Seiten mit Ergebnissen sind oder 22, es sagt immer 208.
mchid
Siehe auch searchengineland.com/…
1110101001

Antworten:

6

Ich kenne die genaue Antwort nicht - vielleicht weiß es niemand außerhalb von Google. Aber ich habe zwei Datenpunkte, die nützlich sein können.

Das erste ist, wie XKCD das Problem aufgreift :

Es sieht also wirklich so aus, als gäbe es eine bestimmte Schwelle für das Ergebnisvolumen, ab der Google anscheinend "Screw it" sagt und eine gigantische Zahl herauswirft. Ich stelle mir vor, dass dies wahrscheinlich eher auf Inkompetenz als auf vorsätzliche Täuschung zurückzuführen ist. Ich bin mir sicher, dass es schwierig ist, Seiten aus vielen Quellen schnell zu generieren, und für Suchanfragen mit vielen Ergebnissen haben sie möglicherweise keine Zeit, alles zu synchronisieren. Also fummeln sie an den Zahlen herum. Die Tatsache, dass es so aussieht, als hätten sie weit mehr Ergebnisse als sie, ist vermutlich nur ein unbeabsichtigter Bonus.

Der zweite Datenpunkt stammt von einem Informatikprofessor, den ich hatte, der ziemlich neugierig auf das Problem war und einige Freunde bei Google darüber störte. Sie sagten ihm, dass es manchmal sehr teuer wird, herauszufinden, wie viele Ergebnisse wirklich von einer Suche zurückgegeben wurden, also raten sie einfach am besten und geben die erste Ergebnisseite zurück, die den meisten Menschen am Herzen liegt. Erst wenn Sie tatsächlich einen Drilldown durch die Seiten durchführen, macht sich Google die Mühe, die verbleibenden Seiten vollständig zu berechnen.

Beides ist also keine endgültige Antwort, aber sie werden hoffentlich hilfreich sein, um die Arten von Problemen zu erklären, die möglicherweise zu Ungenauigkeiten bei Google führen.

BEARBEITEN:

Sathyas Antwort auf dieser Seite enthält eine Antwort von Googles Webmaster KB.

Wenn Sie eine Suche durchführen, werden die Ergebnisse häufig mit den folgenden Informationen angezeigt: Ergebnisse 1 - 10 von ca. XXXX.

Die Berechnung der Gesamtzahl der Suchergebnisse durch Google ist eine Schätzung. Wir verstehen, dass eine Baseball-Figur wertvoll ist, und indem wir eine Schätzung anstelle eines genauen Kontos angeben, können wir qualitativ hochwertige Suchergebnisse schneller zurückgeben.

Wenn Sie auf die nächste Seite der Suchergebnisse klicken, kann sich außerdem die Gesamtzahl der Suchergebnisse ändern. In diesem Fall stellen wir fest, dass einige der Abfrageergebnisse Duplikate sind, und reduzieren diese Duplikate, damit Sie das gewünschte Ergebnis leichter finden können. Durch das Reduzieren der Duplikate wird die geschätzte Anzahl der Ergebnisse sowie die Gesamtzahl der Ergebnisseiten verringert.

dsolimano
quelle
Während ich XKCD und liebe ehemalige Lehrer liebe, sagen Sie mir, dass ich dies wahrscheinlich auf stackoverflow.com fragen sollte: P
cregox
Ich glaube nicht, dass jemand bei stackoverflow eine endgültige Antwort haben wird - wenn Sie es wirklich wissen müssen, sollten Sie Google fragen. Ich kann die Antwort nur von jemandem weiterleiten, der Google vor einigen Monaten gefragt hat.
Dsolimano
Ich suche keine endgültige Antwort, nur eine mit einer vernünftigeren, tieferen Erklärung, vorzugsweise mit guten Quellen. Versteh mich nicht falsch, deine ist vernünftig, aber zu sagen "weil es schwer ist", auch wenn es maßgeblich und sinnvoll ist, ist mir zu wenig. Hmm ... vielleicht Skeptiker.se: o
Cregox
Nizza bearbeiten, jetzt ist das gute Beschaffung! Obwohl es immer noch "weil es schwer ist" heißt, was bedeutet, dass ich immer noch auf weitere Details hoffe. : P
Cregox
7

Nein - die Zahl ist nur eine Annäherung .

Wenn Sie eine Suche durchführen, werden die Ergebnisse häufig mit den folgenden Informationen angezeigt: Ergebnisse 1 - 10 von ca. XXXX.

Die Berechnung der Gesamtzahl der Suchergebnisse durch Google ist eine Schätzung. Wir verstehen, dass eine Baseball-Figur wertvoll ist, und indem wir eine Schätzung anstelle eines genauen Kontos angeben, können wir qualitativ hochwertige Suchergebnisse schneller zurückgeben.

Wenn Sie auf die nächste Seite der Suchergebnisse klicken, kann sich außerdem die Gesamtzahl der Suchergebnisse ändern. In diesem Fall stellen wir fest, dass einige der Abfrageergebnisse Duplikate sind, und reduzieren diese Duplikate, damit Sie das gewünschte Ergebnis leichter finden können. Durch das Reduzieren der Duplikate wird die geschätzte Anzahl der Ergebnisse sowie die Gesamtzahl der Ergebnisseiten verringert.

Sathyajith Bhat
quelle
Ich denke, dies ist kein gutes Verhalten, wenn sie die Anzahl der Ergebnisse immer auf mehr oder weniger 1000 beschränken. Wenn der Benutzer mehr möchte, sollte er mehr anzeigen. Aus meiner Sicht sollten einige gebräuchliche Keywords wirklich viele Suchergebnisse liefern (wie Blumen, Bücher ...), und ich denke, dass es im Internet unzählige verschiedene Bilder gibt!
@ user11656 Sie gehen davon aus, dass die Google Bildsuche genauso funktioniert wie eine Suche in einer Standard-App, die Sie möglicherweise verwenden. In dieser Größenordnung funktionieren die Dinge normalerweise sehr unterschiedlich. Es gibt wahrscheinlich keine einzige Antwort für "Alle Bilder, die mit Blumen übereinstimmen", da ein Server in Australien möglicherweise ein kürzlich hochgeladenes Bild hat, das noch nicht auf den Server in den USA übertragen wurde. Dann müssen Sie sich mit Dingen wie dem Präsentieren von Duplikaten und dem sofortigen Erstellen all dieser Funktionen für Millionen von Benutzern für Millionen von Benutzern befassen. Es ist hart und man muss architektonische Kompromisse eingehen.
George Mauer
3

Die Anzahl der Google-Ergebnisse ist eine bedeutungslose Metrik . Abgesehen vom Reduzieren von Duplikaten haben Sie auch Stemming, die Art und Weise, wie die Zählungen in erster Linie durch Multiplikation von Frequenzen berechnet werden, und die Tatsache, dass Google eine Obergrenze festlegt, die die maximale Anzahl von Ergebnissen festlegt, die jemals zurückgegeben werden.

JdeBP
quelle
2

Keine der obigen Antworten ist richtig.

Die Schätzung von Google muss näher an der tatsächlichen Anzahl der Ergebnisse liegen als angegeben.

Dies kann anhand eines einfachen Beispiels gezeigt werden. Wählen Sie ein etwas häufiges Wort wie "Russland" oder "Michael". In Wahrheit muss es Tausende, wenn nicht Hunderttausende von Websites im Internet geben, die diese Wörter irgendwo auf ihrer Website enthalten. Bei Google-Ergebnissen erhalten Sie jedoch möglicherweise nur 700.

Die Wahrheit ist nicht, dass Google große Überschätzungen gibt, sondern dass Google jetzt die Anzahl der Ergebnisse, die es Ihnen geben wird, stark einschränkt. Es verkürzt die Ergebnisse erheblich, zu unserem größten Nachteil als Einzelpersonen. Es ist bedauerlich, weil ich in einigen Fällen die Tausenden von Websites mit meinen Begriffen lesen möchte.

Ich weiß das, weil ich Google schon lange verwendet habe, vielleicht 10 bis 15 Jahre, und festgestellt habe, dass die Ergebnisse für Begriffe in der Regel kürzer und nicht länger geworden sind, obwohl die Anzahl der Websites mit denselben Begriffen im Allgemeinen gleich sein muss haben in der Zeit, in der ich Google verwendet habe, zugenommen.

Während ich vor Jahren für einige Begriffe vielleicht 1000 Ergebnisse erhalten konnte, erhalte ich jetzt 500 Ergebnisse für dieselben Begriffe, für die ich 1000 Ergebnisse erhalten hätte.

Rakovsky
quelle
2
Bitte beachten Sie, dass "oben" keinen Kontext in Antworten hat, da diese auf verschiedene Arten sortiert werden können. Selbst wenn Sie die Standardsortierung nach "Stimmen" annehmen, ändern sich ihre Positionen, wenn Auf- und Abstimmen hinzugefügt werden.
Ale
Sehr interessant! Russland gibt mir momentan nur 322 Ergebnisse und das zeigt es nur auf der allerletzten 34. Seite . Bis dahin würde es 799 000 000 Ergebnisse sagen! Dies ist zwar eine schöne Einsicht, scheint aber immer noch nicht richtig zu sein. Ich denke auch nicht, dass die ersten Schätzungen korrekt sind, und die Absicht ist, nur Ergebnisse zu liefern, die angezeigt werden, nicht "wie viele davon im Web vorhanden sind", daher die letzte Seite, die dies behebt.
Cregox
1

Das Problem mit der Google-Suchmaschine (Bild) besteht darin, dass sie durch Verringern der Varianz auf Relevanz abzielt. Erstens ist es wichtig zu verstehen, wie es funktioniert. Ein ins Internet hochgeladenes Bild muss auf zwei Arten indiziert werden:

  • basierend auf Originalität (das Bild wird von einem "intelligenten Bot" analysiert, basierend auf Farbe, Größe, Mustern, Formerkennung, Typ usw.)
  • basierend auf Ähnlichkeit (Bild wird von einem "intelligenten Bot2" analysiert und mit bereits vorhandenen Bildern in einer Datenbank verglichen und weiter mit einem oder zwei Kategorielabels versehen: "Bild stimmt überein" und "Bild ähnelt ... ")

Nach Abschluss der Indizierung erbt das Bild als Ergebnis der Erkennung "Schlüsselwörter", um zu vermeiden, dass dem Endbenutzer Ergebnisse außerhalb des Themas angezeigt werden. Die Sache ist, dass jedes Keyword eine eigenständige Phrase mit einem zugewiesenen Wert in% ist, basierend auf der Stärke der Relevanz (daher führt das Gruppieren von mehr Wörtern im Suchfeld zu weniger Ergebnissen und auch, wenn Sie nach einem Bild suchen, indem Sie es hochladen oder die URL Google eingeben wird eine "Vermutung" mit nur Top-Keywords zuweisen, was bedeutet, dass die Suche niemals alle Bilder anzeigt, nur weil die Suche nicht dafür ausgelegt ist)

Wenn Sie also am Ende eines Tages eine Bildsuche durchführen und direkt unter dem Suchfeld eine enorme Zahl mit der Aufschrift "25.270.000.000 Ergebnisse (0,55 Sekunden)" sehen, handelt es sich meistens immer um eine gefälschte Zahl, da Sie keine weitere erhalten als 200 (max. 500, jedoch nur nach Aufforderung durch den Benutzer) Ergebnisse, die ebenfalls gefiltert werden, um Folgendes auszuschließen:

  • externe Duplikate (wenn dasselbe Bild mehr als 2 Mal auf derselben Site-Seite vorhanden ist)
  • Relevanzduplikate (zeigt nur "beste Ergebnisse" - siehe Bild unten)
  • Bilder, die Probleme mit dem Gesetz haben (siehe Bild unten)
  • Bilder, die gegen DMCA verstoßen (siehe Bild unten)
  • Bilder, die aus SPAM-, MALWARE- und PHISHING-Quellen stammen
  • Bilder, die ausgeblendet sind (wenn ein Benutzer die sichere Suche nicht deaktiviert hat)
  • Bilder, die von Google auf die schwarze Liste gesetzt wurden ( Artikel )
  • Bilder mit unterschiedlichem AR (im Grunde alle Bilder, die ein anderes Seitenverhältnis als die Bildsuchreferenz haben. Sie können beispielsweise alle gewünschten Ergebnisse verpassen, wenn Sie nach dem von Ihnen ausgewählten Bild suchen - sagen wir mit einem seltsamen Verhältnis von 9: 7 -, während alle Bilder indiziert sind Google hat ein Verhältnis von 3: 4 - was vielleicht der größte Nachteil dieser Suchmaschine ist, da das Seitenverhältnis immer als erstes Kriterium eingehalten wird.
  • und ein paar mehr

Um es zusammenzufassen: Suchergebnisse eines Bildes sind niemals vollständig relevant. Manchmal erhalten Sie Ihr gewünschtes Endergebnis mit einem Suchbegriff "Gate Poster", andernfalls kann es sich um "Gate Cover", "Gate Bluray", "Gate DVD", "Gate 2015" oder sogar "自衛隊 彼 の 地 に て 斯 斯 く 戦" handelnえ り "- Sie können einfach nicht" ALLE "Bildergebnisse haben, da es nichts gibt, was" ALL "ist. Deshalb müssen Sie damit spielen, um dorthin zu gelangen. Und es ist auch wichtig zu erwähnen, dass es andere Bildsuchmaschinen gibt, die ihre Arbeit anders erledigen können, weil sie nach unterschiedlichen Standards und Kriterien arbeiten. Es ist nicht und war nie "nur Google" ... >> https://www.yandex.com/images/

bemerkenswerte Erweiterungen:

user0
quelle
Auch hier wäre es viel hilfreicher, diese als Duplikate zu markieren, als die Antwort auf jede Frage zu veröffentlichen.
Jonsca
0

Oben steht Seite 70 von 7000 Ergebnissen (Beispiel). Es gibt die Seitenzahl und wie viele Ergebnisse. Es gibt nicht 70 Ergebnisse, sondern 70 Seiten. Hoffe das hilft.

Aaron Ford
quelle