Ich habe diese Frage in Bezug auf eine groß angelegte Regression ( Link ) gelesen , in der whuber einen interessanten Punkt wie folgt hervorhob :
"Nahezu jeder statistische Test, den Sie durchführen, ist so leistungsfähig, dass Sie mit ziemlicher Sicherheit einen" signifikanten "Effekt feststellen können. Sie müssen sich viel mehr auf statistische Wichtigkeit konzentrieren, z.
--- whuber
Ich habe mich gefragt, ob dies bewiesen werden kann oder ob es sich in der Praxis nur um einige häufige Phänomene handelt.
Jeder Hinweis auf einen Beweis / eine Diskussion / eine Simulation wäre wirklich hilfreich.
regression
statistical-significance
Bayesric
quelle
quelle
Antworten:
Es ist ziemlich allgemein.
Stellen Sie sich vor, es gibt einen kleinen Effekt, der nicht Null ist (dh eine Abweichung von der Null, die der Test erfassen kann).
Bei kleinen Stichproben liegt die Wahrscheinlichkeit der Zurückweisung sehr nahe an der Fehlerrate des Typs I (Rauschen dominiert den kleinen Effekt).
Mit zunehmender Stichprobengröße sollte sich der geschätzte Effekt diesem Bevölkerungseffekt annähern, während gleichzeitig die Unsicherheit des geschätzten Effekts abnimmt (normalerweise als ), bis sich die Wahrscheinlichkeit, dass die Nullsituation nahe genug an dem geschätzten Effekt liegt, der in einer zufällig ausgewählten Stichprobe aus der Grundgesamtheit noch plausibel ist, effektiv auf Null verringert.n--√
Das heißt, mit Punktnullen wird schließlich die Zurückweisung sicher, weil in fast allen realen Situationen im Grunde immer eine gewisse Abweichung von der Null vorhanden ist.
quelle
Dies ist kein Beweis, aber es ist nicht schwer, den Einfluss der Stichprobengröße in der Praxis zu zeigen. Ich möchte ein einfaches Beispiel von Wilcox (2009) mit geringfügigen Änderungen verwenden:
Wir können t-test für diese Analyse verwenden:
Unter der Annahme, dass der Stichprobenmittelwert ( ) 45 beträgt und die Stichprobenstandardabweichung ( en ) 11 beträgt,X¯ s
Wenn Sie an einem Tisch schauen enthält kritische Werte des Student- - Verteilung mit ν Freiheitsgradent ν , werden Sie sehen , dass die für , P ( T ≤ - 1,83 ) = .05 . Mit T = - 1,44 können wir die Nullhypothese nicht ablehnen. Nehmen wir nun an, wir haben den gleichen Stichprobenmittelwert und die gleiche Standardabweichung, aber stattdessen 100 Beobachtungen:v=10−1 P(T≤−1.83)=.05 T=−1.44
Für , P ( T ≤ - 1,66 ) = 0,05 können wir die Nullhypothese verwerfen. Wenn Sie alles andere konstant halten und die Stichprobengröße erhöhen, verringert sich der Nenner, und es ist wahrscheinlicher, dass sich Werte im kritischen Bereich (Ablehnungsbereich) der Stichprobenverteilung befinden. Beachten Sie, dass s / √v=100−1 P(T≤−1.66)=.05 ist eine Schätzung des Standardfehlers des Mittelwerts. So können Sie sehenwie eine ähnliche Interpretation gilt, beispielsweise die Hypothesentests auf den Regressionskoeffizienten inlinearen Regression erhalten, wobeiT= β j - β ( 0 ) js/n−−√ .T=β^j−β(0)jse(β^j)
Wilcox, RR, 2009. Grundlegende Statistik: Konventionelle Methoden und moderne Erkenntnisse verstehen . Oxford University Press, Oxford.
quelle
In der Regression für das Gesamtmodell ist der Test auf F. Hier
quelle