Während ich formal das Konfidenzintervall einer Schätzung ableitete, kam ich zu einer Formel, die der Berechnung des Werts sehr ähnlich ist.
Daher die Frage: Sind sie formal gleichwertig? Dh lehnt eine Hypothese mit einem kritischen Wert gleich nicht zum Konfidenzintervall mit kritischem Wert ?
hypothesis-testing
confidence-interval
p-value
Jorge Leitao
quelle
quelle
Antworten:
Ja und nein.
Zuerst das "Ja"
Was Sie beobachtet haben, ist, dass, wenn ein Test und ein Konfidenzintervall auf derselben Statistik basieren, es eine Äquivalenz zwischen ihnen gibt: Wir können den Wert als den kleinsten Wert von interpretieren, für den der Nullwert des Parameters würde in das Konfidenzintervall einbezogen .p α 1−α
Sei ein unbekannter Parameter im Parameterraum , und sei die Stichprobe ist eine Realisierung der Zufallsvariablen . Definieren Sie der Einfachheit halber ein Konfidenzintervall als ein zufälliges Intervall, so dass dessen Überdeckungswahrscheinlichkeit (Sie könnten auch allgemeinere Intervalle in Betracht ziehen, bei denen die Wahrscheinlichkeit der Erfassung entweder durch begrenzt ist oder ungefähr gleich . Die Begründung ist analog.)θ Θ⊆R x=(x1,…,xn)∈Xn⊆Rn X=(X1,…,Xn) Iα(X)
Betrachten Sie einen zweiseitigen Test der Punkt-Null-Hypothese gegen die Alternative . Es sei der p-Wert des Tests. Für jede , wird auf der Ebene abgelehnt wenn . Die Stufe Zurückweisungsregion ist die Menge von die zur Zurückweisung von :H0(θ0):θ=θ0 H1(θ0):θ≠θ0 λ(θ0,x) α∈(0,1) H0(θ0) α λ(θ0,x)≤α α x H0(θ0)
Betrachten Sie nun eine Familie von zweiseitigen Tests mit p-Werten für . Für eine solche Familie können wir einen invertierten Zurückweisungsbereichλ(θ,x) θ∈Θ
Für jedes feste ; wird abgelehnt, wenn ; , was genau dann geschieht, wenn & ; das heißt, Wenn der Test auf einer Teststatistik mit einer vollständig spezifizierten absolut kontinuierlichen basiert, dann ist unter . Dann ist Da diese Gleichung für jedesθ0 H0(θ0) x∈Rα(θ0) θ0∈Qα(x)
Nachfolgend wird eine Abbildung gezeigt, die die Abstoßungsbereiche und Konfidenzintervalle zeigt, die dem Test für einen normalen Mittelwert für verschiedene Nullmittelwerte und verschiedene Stichprobenmittelwerte mit . wird verworfen, wenn im schattierten hellgrauen Bereich liegt. Dunkelgrau dargestellt ist der Zurückweisungsbereich und das Konfidenzintervall .z θ x¯ σ=1 H0(θ) (x¯,θ) R0.05(−0.9)=(−∞,−1.52)∪(−0.281,∞) I0.05(1/2)=QC0.05(1/2)=(−0.120,1.120)
(Ein Großteil davon stammt aus meiner Doktorarbeit .)
Nun zum "Nein"
Oben habe ich die Standardmethode zum Erstellen von Konfidenzintervallen beschrieben. In diesem Ansatz verwenden wir eine Statistik, die sich auf den unbekannten Parameter bezieht, um das Intervall zu konstruieren. Es gibt auch Intervalle, die auf Minimierungsalgorithmen basieren und versuchen, die Länge der Intervallbedingung für den Wert von zu minimieren . In der Regel entsprechen solche Intervalle keinem Test.θ X
Dieses Phänomen hat mit Problemen zu tun, die damit zusammenhängen, dass solche Intervalle nicht verschachtelt sind, was bedeutet, dass das 94% -Intervall kürzer sein kann als das 95% -Intervall. Weitere Informationen hierzu finden Sie in Abschnitt 2.5 meines jüngsten Papiers (erscheint in Bernoulli).
Und ein zweites "Nein"
In einigen Fällen basiert das Standard-Konfidenzintervall nicht auf derselben Statistik wie der Standardtest (wie in diesem Artikel von Michael Fay erläutert ). In diesen Fällen liefern Konfidenzintervalle und Tests möglicherweise nicht dieselben Ergebnisse. Zum Beispiel kann vom Test zurückgewiesen werden, obwohl 0 im Konfidenzintervall enthalten ist. Dies widerspricht nicht dem obigen "Ja", da unterschiedliche Statistiken verwendet werden.θ0=0
Und manchmal ist "ja" keine gute Sache
Wie von f coppens in einem Kommentar hervorgehoben, haben Intervalle und Tests manchmal etwas widersprüchliche Ziele. Wir wollen kurze Intervalle und Tests mit hoher Leistung, aber das kürzeste Intervall entspricht nicht immer dem Test mit der höchsten Leistung. Für einige Beispiele dafür finden Sie dieses Papier (multivariate Normalverteilung), oder diese (Exponentialverteilung) oder § 4 meiner Arbeit .
Bayesianer können auch Ja und Nein sagen
Vor einigen Jahren habe ich hier eine Frage gestellt, ob eine Testintervalläquivalenz auch in der Bayes'schen Statistik existiert. Die kurze Antwort ist, dass bei Verwendung von Standard-Bayes'schen Hypothesentests die Antwort "nein" lautet. Wenn Sie das Testproblem ein wenig umformulieren, lautet die Antwort jedoch "Ja". (Meine Versuche, meine eigene Frage zu beantworten, wurden schließlich zu einer Zeitung !)
quelle
Bei der Betrachtung eines einzelnen Parameters ist es möglich, dass ein Test über den Wert des Parameters und das Konfidenzintervall "nicht übereinstimmt", je nachdem wie diese aufgebaut sind. Insbesondere ist ein Hypothesentest ein Level -Test, wenn er die Nullhypothese als Anteil der Zeit ablehnt, zu der die Nullhypothese wahr ist. Aus diesem Grund kann man zB Schätzungen von Modellparametern (zB der Varianz) verwenden, die nur unter der Nullhypothese gültig sind. Wenn man dann versucht, ein CI durch Invertieren dieses Tests zu konstruieren, stimmt die Abdeckung unter der alternativen Hypothese möglicherweise nicht ganz. Aus diesem Grund würde man in der Regel ein Konfidenzintervall anders konstruieren, damit die Abdeckung auch unter der Alternative stimmt, was dann zu einer (meist sehr kleinen) Fehlanpassung führen kann.α ≤α
quelle