Warum ist der F-Test in linearen Gauß-Modellen am leistungsfähigsten?

12

Für ein lineares Gauß-Modell Y=μ+σG bei dem angenommen wird, dass μ in einem Vektorraum W und G die Standardnormalverteilung auf Rn , ist die Statistik des F Tests für H0:{μU} wobei UW ist ein Vektorraum, eine zunehmende Eins-zu-Eins-Funktion der Abweichungsstatistik : Woher wissen wir, dass diese Statistik den leistungsstärksten Test fürH0liefert(möglicherweise nachdem ungewöhnliche Sonderfälle verworfen wurden)? Dies ergibt sich nicht aus dem Neyman-Pearson-Theorem, da dieses Theorem besagt, dass der Likelihood-Ratio-Test für PunkthypothesenH0am leistungsfähigsten ist:{μ=μ0,σ=σ0}undH1:{

f=ϕ(2logsupμW,σ>0L(μ,σ|y)supμU,σ>0L(μ,σ|y)).
H0H0:{μ=μ0,σ=σ0} .H1:{μ=μ1,σ=σ1}
Stéphane Laurent
quelle
MLR-Familien und der Karlin-Rubin-Satz könnten hier relevant sein.
Whuber
Sie können so umschreiben , dass es eine Form wie H 0 hat :H0:μU (entgegen der Alternative, dass es nicht 0 ist). Im Wesentlichen wird sich δ umH0:δ=0δW/U
0:17 Uhr
@ Glen_b Und dann meinst du, dass Neyman-Pearson-Theorem die Schlussfolgerung liefert?
Stéphane Laurent
1
Ich bin kein Experte für dieses Material, und es wird wahrscheinlich etwas Wichtiges geben, das ich verpasst habe, aber ich denke, Neyman & Pearsons Artikel diskutiert Hypothesen, die andere nicht spezifizierte Parameter als die im Test genannten enthalten. Das ist wahrscheinlich einen Blick wert.
Glen_b
2
Dear @ StéphaneLaurent: Wir können das nicht wissen, weil es nicht wahr ist.
Kardinal

Antworten:

5

Ich bin dieser Frage seit einiger Zeit nachgegangen, in der Hoffnung, dass jemand mit einem tieferen Einblick in die klassische Testtheorie erklären könnte, warum dieser Test im Allgemeinen nicht einheitlich am leistungsfähigsten ist - so wie @cardinal in einem Kommentar schreibt. Es ist eine Folklore, dass einheitlich leistungsfähigste Tests nur für einseitige Hypothesen zu univariaten Parametern konstruiert werden können, aber ein solcher Kommentar beantwortet die Frage nicht wirklich.F

Beispiel 5.5 in Theoretical Statistics von Cox und Hinkley zeigt, dass die t Test ein einheitlich leistungsstärkster ähnlicher Test für einen univariaten Mittelwert mit unbekannter Varianz ist. Unter Bezugnahme auf Techniken in The Analysis of Varianz von Scheffé behauptet dasselbe Beispiel, dass der Test einer Hypothese zu einem Parameter im multivariaten Fall immer noch ein einheitlich leistungsstärkster ähnlicher Test ist, wobei die übrigen Parameter und die Varianz als Störparameter gelten. Wenn die Codimension von U 1 ist, entspricht der F- Test einem t- Test.tUFt

Beispiel 5.20, immer noch in Cox und Hinkley, betrachtet eine Einweg-ANOVA. Es wird argumentiert, dass es im Fall von mindestens drei Gruppen keinen einheitlich leistungsstärksten ähnlichen Test für die Hypothese gibt, dass es keine Unterschiede zwischen den Gruppen gibt. Dies liefert die Zutaten, um zu zeigen, dass der Test nicht einheitlich am leistungsfähigsten ist, da es für bestimmte Alternativen leistungsfähigere t- Tests gibt. Der F- Test ist jedoch der gleichmäßig leistungsstärkste Invariantentest .FtF

Was bedeutet also ähnlich und invariant ? Eine verschachtelte Folge von kritischen Bereichen für Tests der Grße wird alsähnlich bezeichnet,wenn die Wahrscheinlichkeit einer Zurückweisung gemäß der Hypothese α ist (für alle möglichen Auswahlen von Störparametern). Der Test istinvariant,wenn die kritischen Bereiche unter einer Gruppe von Transformationen invariant sind. Für die Einweg-ANOVA ist die Gruppe eine Gruppe von orthogonalen Transformationen. Ich empfehle, Kapitel 5 in Cox und Hinkley zu lesen, um weitere Einzelheiten zu erfahren. Siehe auch Abschnitt 2.10 in Scheffés Buch über die optimalen Eigenschaften des F- Tests.α[0,1]αF

NRH
quelle