Was passiert bei einem t-Test mit einer Stichprobe, wenn im Varianzschätzer der Stichprobenmittelwert durch

10

Nehmen Sie einen t-Test mit einer Stichprobe an, bei dem die Nullhypothese . Die Statistik ist dann t = ¯ x - μ 0μ=μ0 Verwendung der Stichprobenstandardabweichungs. BeiAbschätzungs, vergleicht man die Beobachtungen der Probe Mittelwert¯x:t=x¯μ0s/nssx¯

.s=1n1i=1n(xix¯)2

Wenn wir jedoch annehmen, dass ein gegebenes wahr ist, könnte man auch die Standardabweichung s ∗ unter Verwendung von μ 0 anstelle des Stichprobenmittelwerts ¯ x :μ0sμ0x¯

.s=1n1i=1n(xiμ0)2

Für mich sieht dieser Ansatz natürlicher aus, da wir die Nullhypothese folglich auch zur Schätzung der SD verwenden. Weiß jemand, ob die resultierende Statistik in einem Test verwendet wird oder warum nicht?

Michael
quelle
s2=1n(xiμ0)2σ2x¯μ0s/n

Antworten:

6

In diesem Beitrag gab es ein Problem mit der ursprünglichen Simulation, das hoffentlich jetzt behoben ist.

μ0s/n

x¯μ

Dies bedeutet, dass der Test keine t-Verteilung mehr unter der Null hat. Es ist kein schwerwiegender Fehler, aber es bedeutet, dass Sie nicht einfach Tabellen verwenden und das gewünschte Signifikanzniveau erhalten können (wie wir gleich sehen werden). Das heißt, der Test wird konservativ und dies wirkt sich auf die Leistung aus.

Wenn n groß wird, wird diese Abhängigkeit weniger ein Problem (nicht zuletzt, weil Sie die CLT für den Zähler aufrufen und den Satz von Slutsky verwenden können, um zu sagen, dass es für die modifizierte Statistik eine asymptotische Normalverteilung gibt).

μ0sn=10

n = 10

Geben Sie hier die Bildbeschreibung ein

Sie können sehen, dass die Leistungskurve niedriger ist (sie wird bei niedrigeren Stichprobengrößen viel schlimmer), aber ein Großteil davon scheint darauf zurückzuführen zu sein, dass die Abhängigkeit zwischen Zähler und Nenner das Signifikanzniveau gesenkt hat. Wenn Sie die kritischen Werte entsprechend anpassen, würde selbst bei n = 10 wenig zwischen ihnen liegen.

n=30

n = 30

Geben Sie hier die Bildbeschreibung ein

Dies deutet darauf hin, dass bei nicht kleinen Stichprobengrößen nicht allzu viel zwischen ihnen liegt, solange Sie keine sehr kleinen Signifikanzniveaus verwenden müssen.

Glen_b - Monica neu starten
quelle
9

nn1μ0

x¯μ0

x¯

Greg Snow
quelle