Beispiele dafür, wann Konfidenzintervall und glaubwürdiges Intervall zusammenfallen

11

In dem Wikipedia-Artikel über glaubwürdiges Intervall heißt es:

Für den Fall eines einzelnen Parameters und von Daten, die in einer einzigen ausreichenden Statistik zusammengefasst werden können, kann gezeigt werden, dass das glaubwürdige Intervall und das Konfidenzintervall zusammenfallen, wenn der unbekannte Parameter ein Standortparameter ist (dh die Vorwärtswahrscheinlichkeitsfunktion hat die Form Pr (x | μ) = f (x - μ)) mit einem Prior, der eine gleichmäßige flache Verteilung ist; [5] und auch wenn der unbekannte Parameter ein Skalenparameter ist (dh die Vorwärtswahrscheinlichkeitsfunktion hat die Form Pr (x) | s) = f (x / s)), mit einem Jeffreys-Prior [5] - letzteres folgt, weil der Logarithmus eines solchen Skalierungsparameters ihn in einen Ortsparameter mit einer gleichmäßigen Verteilung verwandelt. Dies sind jedoch ausgesprochen spezielle (wenn auch wichtige) Fälle; im allgemeinen kann keine solche Äquivalenz hergestellt werden. "

Könnten die Leute konkrete Beispiele dafür nennen? Wann entspricht der 95% CI tatsächlich der "95% Chance" und "verletzt" damit die allgemeine Definition des CI?

Wayne
quelle

Antworten:

13

Normalverteilung:

Nehmen Sie eine Normalverteilung mit bekannter Varianz. Wir können diese Varianz als 1 annehmen, ohne die Allgemeinheit zu verlieren (indem wir einfach jede Beobachtung durch die Quadratwurzel der Varianz teilen). Dies hat Stichprobenverteilung:

p(X1...XN|μ)=(2π)N2exp(12i=1N(Xiμ)2)=Aexp(N2(X¯μ)2)

Wobei eine Konstante ist, die nur von den Daten abhängt. Dies zeigt, dass der Stichprobenmittelwert eine ausreichende Statistik für den Populationsmittelwert ist. Wenn wir einen einheitlichen Prior verwenden, ist die hintere Verteilung für :Aμ

(μ|X1...XN)Normal(X¯,1N)(N(μX¯)|X1...XN)Normal(0,1)

Ein glaubwürdiges Intervall hat also die Form:1α

(X¯+1NLα,X¯+1NUα)

Wobei und so gewählt werden, dass eine normale Standardzufallsvariable erfüllt:LαUαZ

Pr(Lα<Z<Uα)=1α

Nun können wir von dieser "Schlüsselgröße" zur Erstellung eines Konfidenzintervalls ausgehen. Die Stichprobenverteilung von für festes ist eine Standardnormalverteilung, daher können wir diese in die obige Wahrscheinlichkeit einsetzen:N(μX¯)μ

Pr(Lα<N(μX¯)<Uα)=1α

Ordnen Sie dann neu an, um nach zu lösen , und das Konfidenzintervall entspricht dem glaubwürdigen Intervall.μ

Skalierungsparameter:

Für Skalierungsparameter haben die PDFs die Form . Wir können die , die . Die gemeinsame Stichprobenverteilung ist:p(Xi|s)=1sf(Xis)(Xi|s)Uniform(0,s)f(t)=1

p(X1...XN|s)=sN0<X1...XN<s

Daraus ergibt sich die ausreichende Statistik, um (dem Maximum der Beobachtungen) zu entsprechen. Wir finden jetzt seine Stichprobenverteilung:Xmax

Pr(Xmax<y|s)=Pr(X1<y,X2<y...XN<y|s)=(ys)N

Jetzt können wir dies unabhängig vom Parameter machen, indem wir . Dies bedeutet, dass unsere "Schlüsselgröße" durch mit was die -Verteilung ist. Wir können also Verwendung der Beta-Quantile so auswählen dass:y=qsQ=s1XmaxPr(Q<q)=qNbeta(N,1)Lα,Uα

Pr(Lα<Q<Uα)=1α=UαNLαN

Und wir ersetzen die zentrale Menge:

Pr(Lα<s1Xmax<Uα)=1α=Pr(XmaxLα1>s>XmaxUα1)

Und da ist unser Konfidenzintervall. Für die Bayes'sche Lösung mit Jeffreys vor haben wir:

p(s|X1...XN)=sN1XmaxrN1dr=N(Xmax)NsN1
Pr(s>t|X1...XN)=N(Xmax)NtsN1ds=(Xmaxt)N

Wir schließen jetzt das Konfidenzintervall an und berechnen seine Glaubwürdigkeit

Pr(XmaxLα1>s>XmaxUα1|X1...XN)=(XmaxXmaxUα1)N(XmaxXmaxLα1)N

=UαNLαN=Pr(Lα<Q<Uα)

Und Presto, wir haben Glaubwürdigkeit und Abdeckung.1α

Wahrscheinlichkeitslogik
quelle
Ein Meisterwerk, danke! Ich hatte gehofft, dass es eine Antwort geben könnte wie: "Bei der Berechnung des Mittelwerts einer Stichprobe aus einer Normalverteilung ist der 95% CI tatsächlich auch das 95% glaubwürdige Intervall" oder so etwas Einfaches. (
Wayne
Ich glaube, dass ein häufiges 95% -Vorhersage- / Toleranzintervall einem Bayes'schen Vorhersageintervall mit OLS-Regression und normalen Fehlern entspricht. Es scheint jedenfalls so, wenn ich die Antwort von Predict.lm mit einer simulierten Antwort vergleiche. Ist das wahr?
Wayne
Wenn Sie für eine einheitliche Priorität für und jeffreys für , haben Sie eine Äquivalenz. Y=α+βXα,βσ
Wahrscheinlichkeitslogik
Vielen Dank! Ich habe versucht, ein CI für eine Regression zu erklären, die ich in Bezug auf ein Konfidenzintervall durchgeführt habe, und es verbindet sich einfach nicht mit einem Laienpublikum, das ein glaubwürdiges Intervall erwartet. Erleichtert mir das Leben viel mehr ... obwohl es vielleicht schlecht für die gesamte statistische Welt ist, da es das Missverständnis des Laien über CIs verstärkt.
Wayne
@Wayne - die Situation ist etwas allgemeiner als nur Familien mit Standortskala. Normalerweise entspricht ein CI einem glaubwürdigen Intervall, wenn es auf einer "ausreichenden Statistik" (wie diese beiden) basiert, in der dies existiert. Wenn keine ausreichende Statistik vorhanden ist, muss CI von sogenannten "Zusatzstatistiken" abhängig sein, um eine glaubwürdige Intervallinterpretation zu erhalten.
Wahrscheinlichkeitslogik