Theorie hinter dem Testen, ob

7

Nehme an, dass Xii.i.d.N(μ,σ2), wo σ2ist bekannt. Anhand dieser Daten möchten wir testen, obμQ, das heißt, ob der Mittelwert μ ist eine rationale Zahl.

Es scheint intuitiv klar zu sein, dass wir dies nicht tun können, da jedes Geräusch zu viel Geräusch sein wird. Ich stelle mir vor, dass jeder Test eine Fehlerrate vom Typ II aufweistβ=0 und Typ I Fehlerrate α=1oder umgekehrt. Aber ich verstehe nicht, wie ich theoretische Aussagen über dieses Problem mit Hypothekentests machen soll. Wie passt dieses Problem in einen allgemeineren Rahmen, der zeigt, wann das Testen "schwierig" ist?

user163964
quelle

Antworten:

7

Ihre Intuition ist richtig: Wenn Sie eine Nullmenge für den Mittelwert haben, der in Bezug auf den Gesamtraum dicht ist, können Sie die Nullmenge und die Alternativmenge nicht durch kontinuierliche Daten unterscheiden. Dies liegt daran, dass wir für jeden Mittelwert in der alternativen Hypothese immer einen erhalten können, der in der Nullmenge "willkürlich nahe" liegt. Daher sollte es niemals Beweise für die alternative Hypothese geben.

Um eine formale Demonstration dieses Ergebnisses zu erhalten, müssen Sie die Bewegungen durchlaufen, dies als zusammengesetzten Hypothesentest zu konstruieren. Dies ist etwas schwierig, da Sie für eine Teststatistik ein Argument vorbringen müssen und hier einige plausible Einwände bestehen.


Formale Konstruktion des klassischen Hypothesentests: Für diesen Test lauten die Hypothesen:

H0:μQ,HA:μQ.

Das erste Problem, auf das Sie stoßen, ist das Erstellen einer Teststatistik. Die Likelihood Ratio (LR) -Statistik für dieses Problem ist immer gleich eins, da die Rationalen in den Realzahlen dicht sind. Wir haben:

supμQsupσ>0i=1nN(xi|μ,σ2)=(n2πxi2)n/2exp(n2)=supμQsupσ>0i=1nN(xi|μ,σ2),

so dass das Verhältnis dieser Supremums Einheit ist. Dies bedeutet, dass die Standard-LR-Statistik nicht als Beweismaß für die Hypothesen dient. Daher benötigen wir eine benutzerdefinierte Teststatistik.

Für diese Hypothesen fällt die ordinale Rangfolge der Beweise nur in zwei Kategorien: Wenn der Stichprobenmittelwert rational ist (was mit der Wahrscheinlichkeit Null auftritt), ist dies ein größerer Beweis für die Nullhypothese; Wenn der Stichprobenmittelwert irrational ist (was mit der Wahrscheinlichkeit eins auftritt), ist dies ein größerer Beweis für die alternative Hypothese. Daher ist die geeignete Teststatistik für den Test mit höheren Werten davon (Indikator-) Teststatistik, die einen besseren Beweis für die Alternative darstellt.TT(X1,...,Xn)I(X¯Q)

Da stetig ist, haben wir über alle Parameterwerte (dies folgt aus der Tatsache, dass die Rationals das Lebesgue-Maß Null haben ). Dies bedeutet, dass die Teststatistik unabhängig von den Parameterwerten dieselbe Verteilung aufweist.X¯N(μ,σ2/n)P(T=0|μ,σ)=P(X¯Q|μ,σ)=0

Wenn wir (dh der Stichprobenmittelwert ist irrational), ist der p-Wert für den Test:x¯Q

pP(T(X¯)t(x¯)|H0)=P(T1|μQ)=1.

Wenn wir (dh der Stichprobenmittelwert ist rational), ist der p-Wert für den Test:x¯Q

pP(T(X¯)t(x¯)|H0)=P(T0|μQ)=1.

Wir sehen also, dass wir selbst mit einer benutzerdefinierten Teststatistik, die versucht, die Hypothesen zu unterscheiden, niemals Beweise gegen die Null erhalten. Dies ist intuitiv sinnvoll, da wir für jeden Mittelwert in der alternativen Hypothese immer einen erhalten können, der in der Nullmenge "willkürlich nahe" liegt.

Ben - Monica wieder einsetzen
quelle
2
Natürlich ist hier alles richtig (+1) - aber ich möchte vorschlagen, dass der Fokus auf die Topologie der Rationalen und Realen und deren Lebesgue-Maß einen grundlegenderen Punkt etwas verfehlt (den Sie ansprechen, aber vielleicht nicht betonen so viel wie du könntest). Wenn z. B. das Modell die Menge von Normalverteilungen mit Parametern wobei für und Andernfalls könnten Sie testenDie grundlegendere Bedeutung von "dicht" liegt in der Topologie des Modells, die durch logarithmische Wahrscheinlichkeitsverhältnisse bestimmt wird. (μ,σ2(μ))σ(μ)=1μQσ(μ)=2H0:μQ.
whuber
2
Guter Punkt - meine eigene Diskussion war nur auf den jeweiligen Fall beschränkt, aber es wäre sicherlich interessant, dies auf eine breitere Diskussion auf diese umfassenderen Fälle auszudehnen.
Ben - Reinstate Monica