Hypothesentest. Warum die Stichprobenverteilung auf H0 zentrieren?

9

Ein p-Wert ist die Wahrscheinlichkeit, eine Statistik zu erhalten, die mindestens so extrem ist wie die in den Probendaten beobachtete, wenn angenommen wird, dass die Nullhypothese ( ) wahr ist.H0

Grafisch entspricht dies dem Bereich, der durch die Stichprobenstatistik unter der Stichprobenverteilung definiert ist, die man erhalten würde, wenn man annimmt :H0

Mitte h0

Da die Form dieser angenommenen Verteilung jedoch tatsächlich auf den Beispieldaten basiert, erscheint es mir eine seltsame Wahl , sie auf zentrieren . Wenn man stattdessen die Stichprobenverteilung der Statistik verwenden würde, dh die Verteilung auf der Stichprobenstatistik zentrieren würde, würde das Testen von Hypothesen der Schätzung der Wahrscheinlichkeit von bei den Stichproben entsprechen.μ 0μ0
μ0

Mitte h1

In diesem Fall ist der p-Wert die Wahrscheinlichkeit, eine Statistik zu erhalten, die mindestens so extrem ist wie wenn die Daten anstelle der obigen Definition verwendet werden.μ0

Zusätzlich hat eine solche Interpretation den Vorteil, dass sie sich gut auf das Konzept der Konfidenzintervalle bezieht:
Ein Hypothesentest mit dem Signifikanzniveau wäre gleichbedeutend mit der Überprüfung, ob innerhalb des -Konfidenzintervalls der Stichprobenverteilung liegt.μ 0 ( 1 - α )αμ0(1α)

CI2 95

Ich bin daher der Meinung, dass das Zentrieren der Verteilung auf eine unnötige Komplikation sein könnte. Gibt es wichtige Gründe für diesen Schritt, die ich nicht berücksichtigt habe?μ0

Matti
quelle
2
Bitte teilen Sie uns die Stichprobenverteilung mit, wenn Sie nicht von ausgehen . (Antwort: Sie können nicht, außer in Lehrbuchbeispielen, in denen die alternative Hypothese eine eindeutige Verteilung angibt.)H0
whuber
Ich bin nicht sicher, ob ich die Anfrage richtig verstehe, aber im obigen Beispiel wäre es die Stichprobenverteilung des Mittelwerts. Ich habe der Frage jetzt eine Zahl hinzugefügt, die diese Verteilung zusammen mit einem 95% -Konfidenzintervall / -bereich zeigt, was auch zur Veranschaulichung der Beziehung zu Konfidenzintervallen beitragen soll.
Matti
2
Sie haben keine Möglichkeit, die Stichprobenverteilung des Mittelwerts zu kennen. Um das zu wissen, müssen Sie den wahren Mittelwert kennen: aber genau das ist die Menge, die Sie testen möchten! Ihre Logik ist völlig kreisförmig.
whuber
1
Ich habe verstanden, dass das deine Bedeutung war. Im Allgemeinen können Sie die Verteilung einer Eigenschaft der Stichprobe erst kennen , wenn Sie die wahren Parameter der Verteilung kennen oder annehmen. (Wenn Sie die Verteilung einer Probeneigenschaft ableiten könnten, ohne die Parameter zu kennen, wäre dies ein Beweis dafür, dass Sie keine Informationen über die Parameter erhalten!)
whuber
1
Ich kann nicht, weil Sie anscheinend keine Begriffe wie "Mittelwert", "geschätzt" oder sogar "H0" in ihren üblichen statistischen Sinnen verwenden. Ich bin völlig ratlos zu verstehen, was Ihre Frage ist. Das einzige, was klar ist, ist, dass es auf einem Missverständnis des Nullhypothesentests beruht, aber Ihre Antworten auf meine Kommentare haben keine nützlichen Hinweise darauf geliefert, was dieses Missverständnis sein könnte.
whuber

Antworten:

5

Angenommen, ist eine Stichprobe aus einer Normalverteilung mit unbekanntem Mittelwert und bekannter Varianz . Der Stichprobenmittelwert ist daher normal mit Mittelwert und Varianz . In dieser Hinsicht kann es meines Erachtens keine Möglichkeit für Meinungsverschiedenheiten geben.X=(X1,X2,,Xn)μσ2X¯μσ2/n

Nun schlagen Sie vor, dass unsere Teststatistik Recht? ABER DAS IST KEIN STATISTIK . Warum? Weil ein unbekannter Parameter ist . Eine Statistik ist eine Funktion der Stichprobe, die nicht von unbekannten Parametern abhängt. Daher muss eine Annahme über werden, damit eine Statistik ist. Eine solche Annahme besteht darin, zu schreiben unter dem das ist eine statistik.

Z=X¯μσ/nNormal(0,1).
μμZ
H0:μ=μ0,vs.H1:μμ0,
ZH0=X¯μ0σ/nNormal(0,1),

Im Gegensatz dazu schlagen Sie vor, selbst zu verwenden. In diesem Fall ist identisch und es ist nicht einmal eine Zufallsvariable, geschweige denn normalverteilt. Es gibt nichts zu testen. Z = 0μ=X¯Z=0

Heropup
quelle
1
Vielen Dank. Das ist sehr einfach und jetzt frage ich mich wirklich, wie ich das vorher hätte übersehen können. Als Entschuldigung für den zweiten vorgestellten Fall bleibt nur die Berechnung des Konfidenzintervalls. Da dort jedoch die Fehlerquote explizit zur Mittelwert- oder Punktschätzung addiert / subtrahiert wird, wird die Verwendung dieser Schätzung zu einem Schritt, der gerechtfertigt werden müsste.
Matti
12

Da die Form dieser angenommenen Verteilung jedoch tatsächlich auf den Beispieldaten basiert, erscheint es mir eine seltsame Wahl, sie auf H0 zu zentrieren.

Das ist eigentlich nicht wahr. Die Form dieser angenommenen Verteilung ergibt sich aus der Annahme von als wahr.H0Die Stichprobe ist nicht direkt daran beteiligt, außer durch einige Annahmen.Die direkte Verwendung der Probe reicht nicht aus. Sie benötigen auch die Nullhypothese, um zu halten.

Wenn man stattdessen die Stichprobenverteilung der Statistik verwenden würde, dh die Verteilung auf der Stichprobenstatistik zentrieren würde, würde das Testen von Hypothesen der Schätzung der Wahrscheinlichkeit von H0 bei den Stichproben entsprechen.

Die Frage ist: Wie schätzen Sie die Wahrscheinlichkeit ein, dass etwas, von dem Sie annehmen, dass es wahr ist? In unserem Fall, wenn Sie als wahr annehmen , ist es sinnlos zu versuchen, die Wahrscheinlichkeit zu schätzen, dass wahr ist.H 0H0H0

Ich halte die Zentrierung der Verteilung auf H0 daher für eine unnötige Komplikation.

Sie haben dort keine zwei Verteilungen, es gibt nur eine, die als Ihre Grundwahrheit angenommen wird, auch bekannt als die, die mit . Es gibt jedoch eine aus der Stichprobe abgeleitete Stichprobenverteilung, die jedoch nicht in den von Ihnen verwendeten Hypothesen enthalten ist.H0

Ich würde gut versuchen, die gleiche Logik mit einer asymmetrischen Verteilung zu replizieren. Nehmen Sie die Chi-Quadrat-Verteilung wie im Chi-Quadrat-Unabhängigkeitstest. Können Sie es reproduzieren? Ich denke die Antwort ist nein.

Rapaio
quelle
" Dies ist tatsächlich nicht wahr. Die Form dieser angenommenen Verteilung ergibt sich aus der Annahme von H0 als wahr. Die Probe ist nicht direkt daran beteiligt, außer durch einige Annahmen. " Aber im Fall des oben dargestellten t-Tests mit einer Probe ist die Die Teststatistik umfasst das SEM und den Stichprobenmittelwert und ist somit abhängig von den Probendaten. Außerdem hängen die Freiheitsgrade, die die Höhe der Schwänze bestimmen, von der Stichprobengröße ab.
t=x¯μ0sn
Matti
1
Meine Formulierung war irreführend. Ich habe versucht zu sagen, dass Sie alle Informationen verwenden können, die Sie haben, auch das Beispiel selbst, aber es ist nicht genug. Um p-Werte zu bewerten und eine Verteilung zu haben, müssen Sie auch die Nullhypothese annehmen. Ich formuliere auch in der Post neu.
Rapaio
1
... Nehmen Sie zum Beispiel Ihre Formel für , sie verwendet was vermutlich der Wert aus der Nullhypotheseμ 0 H 0 : μ = μ 0tμ0H0:μ=μ0
rapaio
2

Soweit ich weiß, argumentieren Sie, dass es sinnvoller ist, und .H 1H0H1

Ich finde es hilfreich, Hypothesentests als Beweis durch Widerspruch zu betrachten. Wir nehmen an, dass wahr ist, und zeigen dann, dass Beweise darauf hinweisen, dass eine solche Annahme fehlerhaft ist, was die Ablehnung von zugunsten von rechtfertigt .H 0 H 1H0H0H1

Dies funktioniert, weil wir, wenn wir annehmen und unsere Verteilung dort , bestimmen können, wie wahrscheinlich / unwahrscheinlich unsere Beobachtung ist. Wenn beispielsweise vs. und wir aus unseren Tests feststellen, dass die Wahrscheinlichkeit, dass der wahre Mittelwert tatsächlich gleich 0 ist, weniger als 5% beträgt , können wir mit 95 ablehnen % Vertrauen.H 0 : μ = 0 H 1 : μ 0 μ H 0H0H0:μ=0H1:μ0μH0

Das Gegenteil ist nicht unbedingt der Fall. Angenommen, wir führen ein Experiment durch und stellen fest, dass die Wahrscheinlichkeit, dass die Nullhypothese weiterhin gilt, tatsächlich bei 30% liegt. Wir können die Null nicht ablehnen, aber wir akzeptieren sie auch nicht . Diese Situation zeigt nicht, dass (die Null) wahr ist, aber dass wir nicht die Beweise haben, um zu zeigen, dass es falsch ist.H0

Stellen Sie sich nun vor, wir hätten diese Situation umgedreht. Nehmen wir an, wir nehmen und stellen fest, dass die Wahrscheinlichkeit von angesichts unserer Ergebnisse 5% oder weniger beträgt. Was bedeutet das? Sicher können wir die Null ablehnen, können wir notwendigerweise akzeptieren ? Es ist schwer zu rechtfertigen, das zu akzeptieren, was wir am Anfang für wahr gehalten haben.H 0 H 1H1H0H1

Zu zeigen, dass falsch ist, ist nicht das Ergebnis, nach dem wir . wir wollen für argumentieren . Indem wir den Test so durchführen, wie Sie es beschreiben, zeigen wir, dass wir keine Beweise dafür haben, dass falsch ist, was sich subtil von der Argumentation unterscheidet, dass wahr ist.H 1 H 1 H 1H0H1H1H1

Bryan Goggin
quelle
Da der Hypothesentest es uns nicht erlaubt, die Unsicherheit vollständig zu beseitigen, würde ich ihn nicht als Beweis ansehen . Vielleicht habe ich meinen Standpunkt nicht klar genug dargelegt, aber ich frage im Wesentlichen eher nach einem logischen als nach einem semantischen Grund, um die Stichprobenverteilung auf . H0
Matti
Und im Allgemeinen ist H1 ziemlich vage (mu! = 0), was Wahrscheinlichkeitsberechnungen problematisch macht. Obwohl ich denke, dass dies oft ein guter Anreiz für Menschen ist, Bayesianisch zu werden. :)
Hao Ye