Gibt es eine nützliche Möglichkeit, das „beste“ Konfidenzintervall zu definieren?

8

Die Standarddefinition von (sagen wir) einem 95% -Konfidenzintervall (CI) erfordert lediglich, dass die Wahrscheinlichkeit, dass es den wahren Parameter enthält, 95% beträgt. Offensichtlich ist dies nicht eindeutig. Die Sprache, die ich gesehen habe, legt nahe, dass es unter den vielen gültigen CI normalerweise sinnvoll ist, so etwas wie das kürzeste oder symmetrische oder genau bekannte zu finden, selbst wenn einige Verteilungsparameter unbekannt sind usw. Mit anderen Worten, es scheint keine zu geben offensichtliche Hierarchie dessen, was CI "besser" ist als andere.

Ich dachte jedoch, dass eine äquivalente Definition von CI darin besteht, dass es aus allen Werten besteht, sodass die Nullhypothese, dass der wahre Parameter diesem Wert entspricht, nach dem Betrachten der realisierten Stichprobe nicht auf dem entsprechenden Signifikanzniveau verworfen wird. Dies deutet darauf hin, dass wir das CI automatisch erstellen können, solange wir einen Test auswählen, den wir mögen. Und es gibt eine Standardpräferenz unter Tests, die auf dem Konzept von UMP basieren (oder UMP unter unvoreingenommenen Tests).

Gibt es einen Vorteil, wenn CI als das definiert wird, das dem UMP-Test entspricht, oder so ähnlich?

max
quelle
(+1) Ihr Vorschlag weist zwei Schwierigkeiten auf. Das erste ist, dass UMP-Tests oft nicht existieren. Das zweite ist, dass ein fruchtbarer Weg zur Bewertung von Konfidenzintervallen in Bezug auf eine verwandte Verlustfunktion besteht. Dies ermöglicht eine flexible, aber vielfältige Lösung.
whuber
1
Die Definition eines Konfidenzintervalls entspricht nicht Ihren Angaben
Jake Westfall
Was ist der Zweck von CI für Sie? Was versuchst du damit zu machen?
Aksakal
@Aksakal eigentlich habe ich gerade gemerkt, dass ich sehr verwirrt über das Konzept bin und es besser verstehen wollte. Nicht anwendungsspezifisch.
Max
@ JakeWestfall Ich fand eine interessante Diskussion, aber keine klare Definition in einem dieser Links. Können Sie mich auf eine bestimmte Definition hinweisen? Ich habe nicht behauptet, dass meine Definition korrekt ist, aber das ist alles, was ich nach einer kurzen Suche in Statistiklehrbüchern gefunden habe. Tatsächlich wird die gleiche Definition in dem in Alex 'Antwort erwähnten Morey-Artikel angeboten
maximal am

Antworten:

1

Ein bisschen lang für einen Kommentar. Lesen Sie die Diskussion über UMPs in diesem Artikel "Der Irrtum, Vertrauen in Konfidenzintervalle zu setzen" von Morey et al. Insbesondere gibt es einige Beispiele, bei denen:

"Noch seltsamer ist, dass die Breite der Intervalle aus dem UMP-Verfahren anfänglich mit der Unsicherheit in den Daten zunimmt. Wenn jedoch die Breite der Wahrscheinlichkeit größer als 5 Meter ist, ist die Breite des UMP-Intervalls umgekehrt proportional zur Unsicherheit in den Daten. wie das nichtparametrische Intervall. Die UMP- und Stichprobenverteilungsverfahren teilen die zweifelhafte Unterscheidung, dass ihre CIs nicht verwendet werden können, um rückwärts zu den Beobachtungen zu arbeiten. Obwohl das UMP-Verfahren das „leistungsfähigste“ Verfahren ist, wirft es wichtige Informationen eindeutig weg. "

Alex R.
quelle
Was ist mit der anderen Richtung? Ist der entsprechende Nullhypothesentest bei einem guten Konfidenzintervall im Allgemeinen gut?
Max
0

Ablehnung ist nur ein Teil der Schlussfolgerung, bleiben Sie dort nicht stecken. Du triffst eine Entscheidung. Angenommen, Sie müssen entscheiden, ob Sie zu einem Mechaniker gehen möchten, wenn die Kontrollleuchte "Motor prüfen" aufleuchtet, oder ob Sie dies vergessen.

Ihre Nullhypothese lautet also, dass der Motor in Ordnung ist und das Licht nur das Ärgernis ist. Die Motorprüflampe ist Ihr Test. Angenommen, der p-Wert beträgt 5%, während Ihre Signifikanz ist. Sie können also die Null nicht ablehnen und mit Ihrem Geschäft fortfahren. So funktioniert statistische Signifikanz in ihrer naiven Form.α=0.01

So müssen Entscheidungen nicht getroffen und wirtschaftliche Bedeutung nicht berücksichtigt werden. Sie müssen die Kosten für Null berechnen, anstatt sie abzulehnen und die alternative Hypo auszuwählen.

Ich habe die alternative Hypothese im obigen Beispiel komplett weggelassen, weil es jeder so macht: Sie denken, alternative Hypo ist nur eine Art Formalität wie Knicks. Im wirklichen Leben ist eine Alternative genauso wichtig wie null, da Sie auf diese Weise die Kosten berechnen, wenn Sie die Null nicht auswählen. Nur wenn Sie die Kosten von null und alternativ berücksichtigen, sollten Sie die Entscheidung treffen, zu einem Mechaniker zu gehen oder nicht. Der p-Wert und die Konfidenzintervalle für sich haben in dieser Hinsicht keine Bedeutung, nur in Verbindung mit den Kosten werden sie bedeutungsvoll

Aksakal
quelle
Ich meine nicht, dass Ablehnung das Ende der Geschichte ist. Ich war nur sehr überrascht, als mir klar wurde, dass alle Definitionen von CI, die ich fand, nicht eindeutige CI zuließen. Bei all den anderen Vorbehalten bei der Verwendung von CI hoffte ich, mich zumindest nicht mit der Tatsache auseinandersetzen zu müssen, dass die Wahl eines bestimmten CI willkürlich ist.
Max