Welche Methode wird in Googles Korrelat verwendet?

8

Hier ist eine aktuelle Google-Korrelatabfrage:
http://www.google.com/trends/correlate/search?e=internet+usage&t=weekly#

Wie Sie im Suchfeld unter diesem Link sehen können, habe ich "Internetnutzung" eingegeben und Google hat den Rest erledigt. Es zeigt einen Wert von 0,9298 als "Korrelation" mit der Abfrage "Data Mining". Wenn ich jedoch Seite 2 des Google-Whitepapers [PDF] lese , heißt es:

The objective of Google Correlate is to surface the queries in
the database whose spatial or temporal pattern is most highly correlated
with a target pattern. Google Correlate employs a novel approximate nearest
neighbor (ANN) algorithm over millions of candidate queries in an online
search tree to produce results similar to the batch-based approach employed
by Google Flu Trends but in a fraction of a second. For additional details,
please see the Methods section below....

Meine Frage lautet also:
Verwendet Google eine normale Pearson- oder Spearman-Korrelation, um dieses Zeug zu finden, oder verwenden sie etwas anderes? Wenn ja, können Sie die allgemeine Technik erklären?

==================

Beachten Sie in der Handlung auch, dass die Suche nach "Internetnutzung" (und "Data Mining") während der Sommermonate abnimmt und wirklich um Weihnachten herum taucht. Ich würde vermuten, dass Kinder und ihre Hausaufgaben etwas damit zu tun haben.

bill_080
quelle
3
Sind das nicht nur Pearson-Korrelationskoeffizienten, wie im Tutorial angegeben ? (Abschnitt Korrelierte Abfragen )
chl
2
@chl: Du hast recht. Ich habe auf die FAQs geklickt, wurde aber vom Whitepaper abgelenkt. Sie verwenden also die Korrelation einer Zeitreihe (nicht die Änderung der Zeitreihe). Das ist wie die Berechnung der Korrelation eines Aktienkurses, nicht der Rendite. Das ist ein bisschen überraschend.
bill_080
3
@chl: Obwohl deine Antwort ein wenig offensichtlich ist, ist sie immer noch eine Antwort, und du solltest es so machen, damit es akzeptiert werden kann.
naught101
1
@ bill_080 Gibt es eine Antwort von Google, warum sich die Daten zwischen den beiden Systemen unterscheiden? Ich fand diese Frage tatsächlich auf der Suche nach einer Erklärung für Ihre Beobachtung
Chandler
1
@chandler: Google hat die E-Mail nie beantwortet. Ich habe eine Weile sowohl mit Trend als auch mit Correlate gespielt, aber beide waren nicht so nützlich wie ich erwartet hatte, also ging ich weiter.
bill_080

Antworten: