Ohne die Antwort von @ttnphns würdigen zu wollen, wollte ich die Antwort aus den Kommentaren entfernen (insbesondere in Anbetracht der Tatsache, dass der Link zum Artikel gestorben war). Die Antwort von Matt Krause bietet eine nützliche Diskussion der Unterscheidung zwischen und , erörtert jedoch nicht die Entscheidung, welche -Formel in einem bestimmten Fall zu verwenden ist.R 2 a d j R 2 a d jR2R2a djR2a dj
Wie ich in besprechen diese Antwort , Yin und Fan (2001) Varianz einen guten Überblick über die vielen verschiedenen Formeln sorgen für die Schätzung Bevölkerung erklärt , von denen alle potentiell eine Art eingestellt bezeichnen könnte .R 2ρ2R2
Sie führen eine Simulation durch, um zu bestimmen, welche einer Vielzahl von angepassten R-Quadrat-Formeln die beste unverzerrte Schätzung für verschiedene Stichprobengrößen, und Prädiktor-Interkorrelationen liefert. Sie schlagen vor, dass die Pratt-Formel eine gute Option sein könnte, aber ich glaube nicht, dass die Studie in dieser Angelegenheit endgültig war.ρ2
Update: Raju et al. (1997) stellen fest, dass sich angepasste Formeln unterscheiden, je nachdem, ob sie für die Schätzung angepasster Annahme von Fixed-x- oder Random-x-Prädikatoren ausgelegt sind. Insbesondere ist die Ezekial-Formel so konzipiert, dass im Kontext mit festem x geschätzt wird , und die Olkin-Pratt- und Pratt-Formeln sind so konzipiert, dass im Kontext mit zufälligem x geschätzt wird . Es gibt keinen großen Unterschied zwischen den Olkin-Pratt- und Pratt-Formeln. Fixed-x-Annahmen stimmen mit geplanten Experimenten überein, Random-x-Annahmen stimmen mit der Annahme überein, dass die Werte der Prädiktorvariablen eine Stichprobe möglicher Werte sind, wie dies in Beobachtungsstudien normalerweise der Fall ist. Weitere Informationen finden Sie in dieser AntwortR 2 ρ 2 ρ 2R2R2ρ2ρ2. Es gibt auch keinen großen Unterschied zwischen den beiden Formeltypen, da die Stichprobengröße mäßig groß wird (siehe hier für eine Erläuterung der Größe des Unterschieds ).
Zusammenfassung der Faustregeln
- Wenn Sie davon ausgehen, dass Ihre Beobachtungen für Prädiktorvariablen eine Zufallsstichprobe aus einer Population sind und Sie für die Gesamtpopulation von Prädiktoren und Kriterium (dh Zufalls-x-Annahme) schätzen möchten, verwenden Sie die Olkin-Pratt-Formel (oder die Pratt-Formel).ρ2
- Wenn Sie davon ausgehen, dass Ihre Beobachtungen festgelegt sind oder Sie nicht über Ihre beobachteten Niveaus des Prädiktors hinaus verallgemeinern möchten, dann schätzen Sie mit der Ezekiel-Formel.ρ2
- Wenn Sie mithilfe der Stichprobenregressionsgleichung wissen möchten, dass die Stichprobenvorhersage nicht funktioniert, sollten Sie sich mit einer Art Kreuzvalidierungsverfahren befassen.
Verweise
- Raju, NS, Bilgic, R., Edwards, JE & Fleer, PF (1997). Methodenüberprüfung: Schätzung der Populationsvalidität und Kreuzvalidität sowie Verwendung gleicher Gewichte bei der Vorhersage. Applied Psychological Measurement, 21 (4), 291-305.
- Yin, P. & Fan, X. (2001). Schätzung der Schrumpfung bei multipler Regression: Ein Vergleich verschiedener Analysemethoden. The Journal of Experimental Education, 69 (2), 203-224. PDFR2