Ein p-Wert ist die Wahrscheinlichkeit, eine Statistik zu erhalten, die mindestens so extrem ist wie die in den Probendaten beobachtete, wenn angenommen wird, dass die Nullhypothese ( ) wahr ist.
Grafisch entspricht dies dem Bereich, der durch die Stichprobenstatistik unter der Stichprobenverteilung definiert ist, die man erhalten würde, wenn man annimmt :
Da die Form dieser angenommenen Verteilung jedoch tatsächlich auf den Beispieldaten basiert, erscheint es mir eine seltsame Wahl , sie auf zentrieren .
Wenn man stattdessen die Stichprobenverteilung der Statistik verwenden würde, dh die Verteilung auf der Stichprobenstatistik zentrieren würde, würde das Testen von Hypothesen der Schätzung der Wahrscheinlichkeit von bei den Stichproben entsprechen.μ 0
In diesem Fall ist der p-Wert die Wahrscheinlichkeit, eine Statistik zu erhalten, die mindestens so extrem ist wie wenn die Daten anstelle der obigen Definition verwendet werden.
Zusätzlich hat eine solche Interpretation den Vorteil, dass sie sich gut auf das Konzept der Konfidenzintervalle bezieht:
Ein Hypothesentest mit dem Signifikanzniveau wäre gleichbedeutend mit der Überprüfung, ob innerhalb des -Konfidenzintervalls der Stichprobenverteilung liegt.μ 0 ( 1 - α )
Ich bin daher der Meinung, dass das Zentrieren der Verteilung auf eine unnötige Komplikation sein könnte.
Gibt es wichtige Gründe für diesen Schritt, die ich nicht berücksichtigt habe?
Antworten:
Angenommen, ist eine Stichprobe aus einer Normalverteilung mit unbekanntem Mittelwert und bekannter Varianz . Der Stichprobenmittelwert ist daher normal mit Mittelwert und Varianz . In dieser Hinsicht kann es meines Erachtens keine Möglichkeit für Meinungsverschiedenheiten geben.X=(X1,X2,…,Xn) μ σ2 X¯ μ σ2/n
Nun schlagen Sie vor, dass unsere Teststatistik Recht? ABER DAS IST KEIN STATISTIK . Warum? Weil ein unbekannter Parameter ist . Eine Statistik ist eine Funktion der Stichprobe, die nicht von unbekannten Parametern abhängt. Daher muss eine Annahme über werden, damit eine Statistik ist. Eine solche Annahme besteht darin, zu schreiben unter dem das ist eine statistik.
Im Gegensatz dazu schlagen Sie vor, selbst zu verwenden. In diesem Fall ist identisch und es ist nicht einmal eine Zufallsvariable, geschweige denn normalverteilt. Es gibt nichts zu testen. Z = 0μ=X¯ Z=0
quelle
Das ist eigentlich nicht wahr. Die Form dieser angenommenen Verteilung ergibt sich aus der Annahme von als wahr.H0
Die Stichprobe ist nicht direkt daran beteiligt, außer durch einige Annahmen.Die direkte Verwendung der Probe reicht nicht aus. Sie benötigen auch die Nullhypothese, um zu halten.Die Frage ist: Wie schätzen Sie die Wahrscheinlichkeit ein, dass etwas, von dem Sie annehmen, dass es wahr ist? In unserem Fall, wenn Sie als wahr annehmen , ist es sinnlos zu versuchen, die Wahrscheinlichkeit zu schätzen, dass wahr ist.H 0H0 H0
Sie haben dort keine zwei Verteilungen, es gibt nur eine, die als Ihre Grundwahrheit angenommen wird, auch bekannt als die, die mit . Es gibt jedoch eine aus der Stichprobe abgeleitete Stichprobenverteilung, die jedoch nicht in den von Ihnen verwendeten Hypothesen enthalten ist.H0
Ich würde gut versuchen, die gleiche Logik mit einer asymmetrischen Verteilung zu replizieren. Nehmen Sie die Chi-Quadrat-Verteilung wie im Chi-Quadrat-Unabhängigkeitstest. Können Sie es reproduzieren? Ich denke die Antwort ist nein.
quelle
Soweit ich weiß, argumentieren Sie, dass es sinnvoller ist, und .H 1H0 H1
Ich finde es hilfreich, Hypothesentests als Beweis durch Widerspruch zu betrachten. Wir nehmen an, dass wahr ist, und zeigen dann, dass Beweise darauf hinweisen, dass eine solche Annahme fehlerhaft ist, was die Ablehnung von zugunsten von rechtfertigt .H 0 H 1H0 H0 H1
Dies funktioniert, weil wir, wenn wir annehmen und unsere Verteilung dort , bestimmen können, wie wahrscheinlich / unwahrscheinlich unsere Beobachtung ist. Wenn beispielsweise vs. und wir aus unseren Tests feststellen, dass die Wahrscheinlichkeit, dass der wahre Mittelwert tatsächlich gleich 0 ist, weniger als 5% beträgt , können wir mit 95 ablehnen % Vertrauen.H 0 : μ = 0 H 1 : μ ≠ 0 μ H 0H0 H0:μ=0 H1:μ≠0 μ H0
Das Gegenteil ist nicht unbedingt der Fall. Angenommen, wir führen ein Experiment durch und stellen fest, dass die Wahrscheinlichkeit, dass die Nullhypothese weiterhin gilt, tatsächlich bei 30% liegt. Wir können die Null nicht ablehnen, aber wir akzeptieren sie auch nicht . Diese Situation zeigt nicht, dass (die Null) wahr ist, aber dass wir nicht die Beweise haben, um zu zeigen, dass es falsch ist.H0
Stellen Sie sich nun vor, wir hätten diese Situation umgedreht. Nehmen wir an, wir nehmen und stellen fest, dass die Wahrscheinlichkeit von angesichts unserer Ergebnisse 5% oder weniger beträgt. Was bedeutet das? Sicher können wir die Null ablehnen, können wir notwendigerweise akzeptieren ? Es ist schwer zu rechtfertigen, das zu akzeptieren, was wir am Anfang für wahr gehalten haben.H 0 H 1H1 H0 H1
Zu zeigen, dass falsch ist, ist nicht das Ergebnis, nach dem wir . wir wollen für argumentieren . Indem wir den Test so durchführen, wie Sie es beschreiben, zeigen wir, dass wir keine Beweise dafür haben, dass falsch ist, was sich subtil von der Argumentation unterscheidet, dass wahr ist.H 1 H 1 H 1H0 H1 H1 H1
quelle