Mir wurde beigebracht, dass wir nach Stichproben aus einer Population eine Parameterschätzung in Form eines Konfidenzintervalls erstellen können. Zum Beispiel sollten 95% -Konfidenzintervalle ohne verletzte Annahmen eine Erfolgsrate von 95% aufweisen, wenn sie den wahren Parameter enthalten, den wir in der Grundgesamtheit schätzen.
Dh
- Erstellen Sie eine Punktschätzung aus einer Stichprobe.
- Erstellen Sie einen Wertebereich, der theoretisch eine Wahrscheinlichkeit von 95% hat, den wahren Wert zu enthalten, den wir zu schätzen versuchen.
Wenn sich das Thema jedoch dem Testen von Hypothesen zugewandt hat, wurden die Schritte wie folgt beschrieben:
- Nehmen Sie einen Parameter als Nullhypothese an.
- Erstellen Sie eine Wahrscheinlichkeitsverteilung der Wahrscheinlichkeit, verschiedene Punktschätzungen zu erhalten, wenn diese Nullhypothese wahr ist.
- Lehnen Sie die Nullhypothese ab, wenn die Punktschätzung, die wir erhalten, in weniger als 5% der Fälle erstellt wird, wenn die Nullhypothese wahr ist.
Meine Frage lautet:
Ist es notwendig, unsere Konfidenzintervalle unter Verwendung der Nullhypothese zu erstellen, um die Null abzulehnen? Warum nicht einfach das erste Verfahren durchführen und unsere Schätzung für den wahren Parameter erhalten (ohne explizit unseren hypothetischen Wert bei der Berechnung des Konfidenzintervalls zu verwenden) und dann die Nullhypothese ablehnen, wenn sie nicht in dieses Intervall fällt?
Dies scheint mir intuitiv logisch gleichwertig zu sein, aber ich befürchte, dass mir etwas sehr Grundlegendes fehlt, da es wahrscheinlich einen Grund gibt, warum es so gelehrt wird.
Antworten:
Ein einfaches Problem ist beispielsweise das Testen des Mittelwerts einer normalen Population mit bekannter Varianz . Dann ist ein Drehpunkt - eine Größe, deren Verteilung nicht vom Parameter abhängt - gegeben durch . Kritische Werte erfüllen in diesem symmetrischen Fall und .ˉ Y - μ ∼ N ( 0 , 1 / n ) z α / 2 Φ ( - z α / 2 ) = α / 2 Φ ( z α / 2 ) = 1 - α / 2σ2=1 Y¯−μ∼N(0,1/n) zα/2 Φ(−zα/2)=α/2 Φ(zα/2)=1−α/2
Daher so dass ist ein Konfidenzintervall der Stufe .
Gleichzeitig ist das Ereignis in der ersten Zeile der Anzeige genau auch das Ereignis, dass die Nullhypothese für dieses nicht verworfen wird . Da der Rest nur äquivalente Umformulierungen enthält, enthält das ci tatsächlich alle für die die Null nicht zurückgewiesen wird, und es wird kein Verweis auf "unter der Null" benötigt.μ μ
Hier ist eine Darstellung analog zu Martijns +1-Visualisierung, die zeigen soll, was als Dualität zwischen Konfidenzintervallen und Tests bekannt ist. bezeichnet das Konfidenzintervall, das zu einem und den Akzeptanzbereich, der zu einer Hypothese .C x¯∗ A(μ0) μ=μ0
quelle
Ja, Sie können einen Hypothesentest (Vergleich der Stichprobe mit einer hypothetischen Verteilung der Testergebnisse) durch einen Vergleich mit einem aus der Stichprobe berechneten Konfidenzintervall ersetzen. Indirekt ist ein Konfidenzintervall jedoch bereits eine Art Hypothesentest, nämlich:
Die Folge einer solchen Bereich zu machen , ist , dass der Bereich nicht nur einen Bruch der Zeit.α
Beispiel
Ich verwende ein Bild aus einer Antwort auf die folgende Frage: Konfidenzintervalle: Wie ich formal mitP(L(X)≤θ,U(X)≥θ)=1−α
Es ist eine Variation eines Diagramms von Clopper-Pearson . Stellen Sie sich den Fall von 100 Bernoulli-Versuchen vor, bei denen die Erfolgswahrscheinlichkeit beträgt und wir die Gesamtzahl der Erfolge .θ X
Beachten Sie, dass:
In vertikaler Richtung sehen Sie Hypothesentests. Beispielsweise lehnen Sie für einen bestimmten hypothetischen Wert die Hypothese ab, wenn das gemessene über oder unter den rot oder grün gepunkteten Linien liegt.θ X
In horizontaler Richtung sehen Sie Clopper-Pearson-Konfidenzintervalle. Wenn Sie für eine bestimmte Beobachtung X diese Konfidenzintervalle verwenden, liegen Sie nur in 5% der Fälle falsch
(weil Sie nur 5% der Zeit ein solches X beobachten, auf das Sie ein "falsches" Intervall stützen)
quelle