Warum jemals F-Statistik verwenden?

8

Wir können die F-Statistik verwenden, um zu bestimmen, ob mindestens einer der Prädiktoren einen Einfluss auf die Antwort hat. Aber warum nicht einfach einen minimalen p-Wert für alle Prädiktoren verwenden? Es ist nicht erforderlich, ein neues Konzept einzuführen.

Yurii
quelle
3
Welchem ​​Test entspricht Ihrer Meinung nach der minimale p-Wert?
whuber
1
Testen Sie, ob mindestens einer der Prädiktoren einen Einfluss auf die Reaktion hat
Yurii
1
Ihre vorgeschlagene Analyse ist unvollständig. Womit vergleichen Sie den kleinsten p-Wert?
Glen_b -Reinstate Monica

Antworten:

9

Hier gehe ich davon aus, dass Sie beabsichtigen, einen Test basierend auf dem minimalen p-Wert mit einem Gesamt-F-Test zu vergleichen.

  1. α

  2. α

  3. Selbst wenn Sie die Mehrfachtests nicht durch Verschieben des Signifikanzniveaus berücksichtigen, können die univariaten Statistiken leicht alle unbedeutend sein, wenn eine klare gemeinsame Beziehung zwischen beiden besteht.

Hier ist ein Beispiel. Zunächst einige Daten:

y:
 4.941, 4.459, 4.116, 3.759, 5.171, 5.101, 5.454, 5.277, 5.402, 
 4.68, 3.433, 5.508, 4.122, 3.355, 3.622, 4.45, 4.872, 4.202, 
 5.276, 4.415, 5.311, 4.105, 3.282, 4.152, 5.416, 4.615, 3.804, 
 5.299, 4.603, 4.868

x1:
 42.305, 16.828, 46.515, 32.567, 40.827, 45.755, 34.227, 43.799, 
 54.659, 34.991, 15.134, 29.115, 20.617, 1.252, 25.844, 19.563, 
 21.53, 22.989, 38.993, 44.955, 30.799, 32.639, 8.707, 46.945, 
 38.992, 25.717, 40.875, 26.049, 36.121, 39.868

x2:
 24.279, 8.844, 27.888, 19.099, 23.732, 28.648, 19.26, 26.578, 
 32.764, 21.302, 8.583, 17.026, 12.047, 0.085, 16.636, 10.021, 
 12.487, 13.745, 23.557, 26.67, 19.881, 20.23, 4.377, 27.865, 
 23.359, 15.006, 25.909, 14.772, 21.5, 23.002

Regressionsausgabe (von R :)

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  3.47760    0.32703  10.634 3.74e-11 
x1           0.14999    0.09194   1.631    0.114    
x2          -0.19524    0.14741  -1.324    0.196    
---    
Residual standard error: 0.5884 on 27 degrees of freedom
Multiple R-squared:  0.3167,    Adjusted R-squared:  0.2661 
F-statistic: 6.257 on 2 and 27 DF,  p-value: 0.005851

Der kleinste p-Wert ist 0,114 - Sie hätten die Nullhypothese ohne Assoziation selbst bei einem Signifikanzniveau von 10% nicht verworfen, aber die allgemeine Regression würde zu einer Ablehnung führen, selbst wenn Ihr Signifikanzniveau 1% wäre. Dies ist ohne das Problem der mehrfachen Tests zu behandeln.

Es ist auch keine Hilfe, separate Regressionen durchzuführen und dort p-Werte zu überprüfen, da (in einem anderen Beispiel als dem oben genannten) es durchaus möglich ist, dass in den univariaten Regressionen keine Beziehung besteht, während in der bivariaten Regression eine starke Beziehung besteht .

Glen_b -Reinstate Monica
quelle
1
Gute Antwort. Relevant für den letzten Punkt ist: stats.stackexchange.com/q/33888/1934 und auch stats.stackexchange.com/q/73869/1934 . Auch im Zusammenhang mit dem Beispiel: stats.stackexchange.com/q/14500/1934
Wolfgang