Daniel Kahneman wirft in " Denken, schnell und langsam" die folgende hypothetische Frage auf:
(S. 186) Julie ist derzeit Seniorin an einer staatlichen Universität. Sie las fließend, als sie vier Jahre alt war. Was ist ihr Notendurchschnitt (GPA)?
Seine Absicht ist es zu veranschaulichen, wie wir es oft versäumen, die Regression auf den Mittelwert zu berücksichtigen, wenn wir Vorhersagen über bestimmte Statistiken treffen. In der anschließenden Diskussion rät er:
(S. 190) Erinnern Sie sich daran, dass die Korrelation zwischen zwei Messgrößen - im vorliegenden Fall dem Lesealter und dem GPA - dem Anteil gemeinsamer Faktoren an ihren Determinanten entspricht. Was ist Ihre beste Vermutung über dieses Verhältnis? Meine optimistischste Schätzung liegt bei 30%. Unter der Annahme dieser Schätzung haben wir alles, was wir brauchen, um eine unvoreingenommene Vorhersage zu erstellen. Hier sind die Anweisungen, wie Sie in vier einfachen Schritten dorthin gelangen:
- Beginnen Sie mit einer Schätzung des durchschnittlichen GPA.
- Bestimmen Sie den GPA, der Ihrem Eindruck vom Beweismaterial entspricht.
- Schätzen Sie die Korrelation zwischen Lesepräzision und GPA.
- Wenn die Korrelation 0,30 beträgt, verschieben Sie 30% des Abstands vom Durchschnitt zum übereinstimmenden GPA.
Meine Interpretation seines Ratschlags lautet wie folgt:
- Verwenden Sie "Sie liest fließend, als sie vier Jahre alt war", um einen Standardwert für Julies Lesepräzision festzulegen.
- Bestimmen Sie eine GPA mit einer entsprechenden Standardbewertung. (Der vorherzusagende rationale GPA würde diesem Standardwert entsprechen, wenn die Korrelation zwischen GPA und Lesegenauigkeit perfekt wäre.)
- Schätzen Sie, wie viel Prozent der Unterschiede in der GPA durch Unterschiede in der Lesegenauigkeit erklärt werden können. (Ich nehme an, er bezieht sich in diesem Zusammenhang auf den Bestimmungskoeffizienten mit "Korrelation"?)
- Da nur 30% des Standardwerts für Julies Lesepräzision durch Faktoren erklärt werden können, die auch den Standardwert für ihren GPA erklären können, können wir zu Recht nur davon ausgehen, dass der Standardwert für Julies GPA 30% des Normalwerts beträgt im Falle einer perfekten Korrelation.
Ist meine Interpretation von Kahnemans Vorgehen korrekt? Wenn ja, gibt es eine formellere mathematische Begründung für sein Verfahren, insbesondere für Schritt 4? Welche Beziehung besteht im Allgemeinen zwischen der Korrelation zwischen zwei Variablen und Änderungen / Unterschieden in ihren Standardbewertungen?