Für ein lineares Gauß-Modell bei dem angenommen wird, dass in einem Vektorraum und die Standardnormalverteilung auf , ist die Statistik des Tests für wobei ist ein Vektorraum, eine zunehmende Eins-zu-Eins-Funktion der Abweichungsstatistik : Woher wissen wir, dass diese Statistik den leistungsstärksten Test fürH0liefert(möglicherweise nachdem ungewöhnliche Sonderfälle verworfen wurden)? Dies ergibt sich nicht aus dem Neyman-Pearson-Theorem, da dieses Theorem besagt, dass der Likelihood-Ratio-Test für PunkthypothesenH0am leistungsfähigsten ist:{μ=μ0,σ=σ0}undH1:{
.
hypothesis-testing
normal-distribution
linear-model
power
likelihood-ratio
Stéphane Laurent
quelle
quelle
Antworten:
Ich bin dieser Frage seit einiger Zeit nachgegangen, in der Hoffnung, dass jemand mit einem tieferen Einblick in die klassische Testtheorie erklären könnte, warum dieser Test im Allgemeinen nicht einheitlich am leistungsfähigsten ist - so wie @cardinal in einem Kommentar schreibt. Es ist eine Folklore, dass einheitlich leistungsfähigste Tests nur für einseitige Hypothesen zu univariaten Parametern konstruiert werden können, aber ein solcher Kommentar beantwortet die Frage nicht wirklich.F −
Beispiel 5.5 in Theoretical Statistics von Cox und Hinkley zeigt, dass diet Test ein einheitlich leistungsstärkster ähnlicher Test für einen univariaten Mittelwert mit unbekannter Varianz ist. Unter Bezugnahme auf Techniken in The Analysis of Varianz von Scheffé behauptet dasselbe Beispiel, dass der Test einer Hypothese zu einem Parameter im multivariaten Fall immer noch ein einheitlich leistungsstärkster ähnlicher Test ist, wobei die übrigen Parameter und die Varianz als Störparameter gelten. Wenn die Codimension von U 1 ist, entspricht der F- Test einem t- Test.t U F t
Beispiel 5.20, immer noch in Cox und Hinkley, betrachtet eine Einweg-ANOVA. Es wird argumentiert, dass es im Fall von mindestens drei Gruppen keinen einheitlich leistungsstärksten ähnlichen Test für die Hypothese gibt, dass es keine Unterschiede zwischen den Gruppen gibt. Dies liefert die Zutaten, um zu zeigen, dass der Test nicht einheitlich am leistungsfähigsten ist, da es für bestimmte Alternativen leistungsfähigere t- Tests gibt. Der F- Test ist jedoch der gleichmäßig leistungsstärkste Invariantentest .F t F
Was bedeutet also ähnlich und invariant ? Eine verschachtelte Folge von kritischen Bereichen für Tests der Grße wird alsähnlich bezeichnet,wenn die Wahrscheinlichkeit einer Zurückweisung gemäß der Hypothese α ist (für alle möglichen Auswahlen von Störparametern). Der Test istinvariant,wenn die kritischen Bereiche unter einer Gruppe von Transformationen invariant sind. Für die Einweg-ANOVA ist die Gruppe eine Gruppe von orthogonalen Transformationen. Ich empfehle, Kapitel 5 in Cox und Hinkley zu lesen, um weitere Einzelheiten zu erfahren. Siehe auch Abschnitt 2.10 in Scheffés Buch über die optimalen Eigenschaften des F- Tests.α∈[0,1] α F
quelle