Liefert ein Konfidenzintervall tatsächlich ein Maß für die Unsicherheit einer Parameterschätzung?

12

Ich habe einen Blog-Beitrag des Statistikers William Briggs gelesen, und die folgende Behauptung hat mich gelinde gesagt interessiert.

Was halten Sie davon?

Was ist ein Konfidenzintervall? Es ist natürlich eine Gleichung, die Ihnen ein Intervall für Ihre Daten liefert. Es soll ein Maß für die Unsicherheit einer Parameterschätzung liefern. Nun, streng nach der frequentistischen Theorie - von der wir sogar annehmen können, dass sie wahr ist - können Sie über das vorliegende CI nur sagen, dass der wahre Wert des Parameters darin liegt oder nicht. Dies ist eine Tautologie, daher ist sie immer wahr. Daher liefert das CI überhaupt kein Maß für die Unsicherheit: Tatsächlich ist es sinnlos, eine zu berechnen.

Link: http://wmbriggs.com/post/3169/

Five σ
quelle
3
Ohne einen genauen Hinweis gibt es hier vor allem keinen Zusammenhang. Es gibt auch keine Möglichkeit, Hinweise auf den Stil und die Referenzen von William Briggs (mir nicht bekannt) zu erhalten. Es könnte sein, dass hier jemand ist, der nur provokativ und empörend sein möchte. Natürlich gibt es auch hier tiefe und schwierige technische und philosophische Fragen, die die Frage sind, aber es ist (nur eine Ansicht) unwahrscheinlich, dass eine Debatte über ein Zitat ohne Hintergrund fruchtbar ist.
Nick Cox
1
@ NickCox Im Hinblick auf das Weglassen des relevanten Kontexts habe ich jetzt den ersten Beitrag bearbeitet.
& sgr; Five
6
Vielen Dank für die Unterstützung. Es ist nur ein Kommentar und mir fehlt die Neigung, ihn zu erweitern, aber meine Reaktion auf drei Wörter ist, dass der letzte Satz eine übertriebene Behauptung ist . Sie können auf viel umfassendere Antworten hoffen.
Nick Cox
1
@ NickCox Kein Problem Nick. Ich schätze Ihre Gefühle jedoch sehr, da es ein Fehler von mir war, meine Frage nicht zu beantworten.
Fünf σ
2
@Nick Ich würde sagen, Briggs hat eines seiner beiden Ziele erreicht: "Die heutigen Gedanken sind nur eine Skizze, um meinen Geist zu klären und eine Diskussion zu beginnen. Das heißt, es ist wahrscheinlich, dass ich meiner eigenen Beschwerde zum Opfer gefallen bin" (dass deine "Nachbarschaft") Statistiker "ist ein" schlampiger Denker ").
whuber

Antworten:

24

Er bezieht sich eher ungeschickt auf die bekannte Tatsache, dass die frequentistische Analyse nicht den Stand unseres Wissens über einen unbekannten Parameter mit einer Wahrscheinlichkeitsverteilung modelliert, sondern ein Konfidenzintervall (etwa 95%) (etwa 1,2 bis 3,4) für berechnet hat Ein Populationsparameter (z. B. der Mittelwert einer Gaußschen Verteilung) aus einigen Daten, die Sie nicht verwenden können, und die Behauptung, dass die Wahrscheinlichkeit eines Mittelwerts zwischen 1,2 und 3,4 bei 95% liegt. Die Wahrscheinlichkeit ist eins oder null - Sie wissen nicht, welche. Im Allgemeinen können Sie jedoch sagen, dass bei der Berechnung der 95% -Konfidenzintervalle sichergestellt ist, dass sie zu 95% den tatsächlichen Parameterwert enthalten. Dies scheint Grund genug zu sagen, dass CIs Unsicherheit widerspiegeln. Wie Sir David Cox es ausdrückte

Wir definieren Verfahren zur Bewertung von Nachweisen, die danach kalibriert werden, wie sie bei wiederholter Verwendung ablaufen würden. Insofern unterscheiden sie sich nicht von anderen Messgeräten.

Weitere Erläuterungen finden Sie hier und hier .

Andere Dinge, die Sie sagen können, variieren je nach der Methode, die Sie zur Berechnung des Konfidenzintervalls verwendet haben. Wenn Sie sicherstellen, dass die inneren Werte aufgrund der Daten wahrscheinlicher sind als die äußeren Punkte, können Sie dies sagen (und dies gilt häufig in etwa für häufig verwendete Methoden). Sehen Sie hier für mehr.

† Cox (2006), Prinzipien der statistischen Inferenz , §1.5.2

Scortchi - Wiedereinsetzung von Monica
quelle
1
Das ist Sir David Cox, stelle ich mir vor.
Nick Cox
@ NickCox: Es ist in der Tat.
Scortchi
Ist die zitierte Analogie von Sir David richtig? (Kein korrektes Zitat, aber eine korrekte Analogie.) Ich stelle mir kein Thermometer vor, das in 95% der Fälle die Temperatur , sondern in 5% der Fälle Temperaturen außerhalb von ± ϵ - und vielleicht weit außerhalb von dieser Bereich? ±ϵ±ϵ
Wayne
1
@Spectrosaurus: Die Beiträge, auf die ich verlinkt habe, werden ausführlicher behandelt. In Ordnung, das Populationsmittel wird nicht als Zufallsvariable modelliert; die Daten X μ sind mit einer Verteilung, die von μ abhängt , und das Konfidenzintervall ( b L ( X μ ) , b U ( X μ ) ) ist eine Funktion der Daten. Pr [ b U ( X μ ) < μ < b U ( X μ )μXμμ(bL(Xμ),bU(Xμ))Pr[bU(Xμ)<μ<bU(Xμ)]=0.95μμ=2
1
Pr[bU(X2)<2<bU(X2)]=0.95μ=7Pr[bU(X7)<7<bU(X7)]=0.95XμPr[1.2<μ<3.4]=0.95, i.e. if μ=2, Pr[1.2<2<3.4]=0.95 & if μ=7, Pr[1.2<2<3.4]=0.95 - which is nonsense.
Scortchi - Reinstate Monica
2

It can be hard to mathematically characterize uncertainty, but I know it when I see it; it usually has wide 95% confidence intervals.

N Brouwer
quelle