Nehmen Sie einen t-Test mit einer Stichprobe an, bei dem die Nullhypothese . Die Statistik ist dann t = ¯ x - μ 0 Verwendung der Stichprobenstandardabweichungs. BeiAbschätzungs, vergleicht man die Beobachtungen der Probe Mittelwert¯x:
.
Wenn wir jedoch annehmen, dass ein gegebenes wahr ist, könnte man auch die Standardabweichung s ∗ unter Verwendung von μ 0 anstelle des Stichprobenmittelwerts ¯ x :
.
Für mich sieht dieser Ansatz natürlicher aus, da wir die Nullhypothese folglich auch zur Schätzung der SD verwenden. Weiß jemand, ob die resultierende Statistik in einem Test verwendet wird oder warum nicht?
mathematical-statistics
variance
t-test
Michael
quelle
quelle
Antworten:
In diesem Beitrag gab es ein Problem mit der ursprünglichen Simulation, das hoffentlich jetzt behoben ist.
Dies bedeutet, dass der Test keine t-Verteilung mehr unter der Null hat. Es ist kein schwerwiegender Fehler, aber es bedeutet, dass Sie nicht einfach Tabellen verwenden und das gewünschte Signifikanzniveau erhalten können (wie wir gleich sehen werden). Das heißt, der Test wird konservativ und dies wirkt sich auf die Leistung aus.
Wenn n groß wird, wird diese Abhängigkeit weniger ein Problem (nicht zuletzt, weil Sie die CLT für den Zähler aufrufen und den Satz von Slutsky verwenden können, um zu sagen, dass es für die modifizierte Statistik eine asymptotische Normalverteilung gibt).
Sie können sehen, dass die Leistungskurve niedriger ist (sie wird bei niedrigeren Stichprobengrößen viel schlimmer), aber ein Großteil davon scheint darauf zurückzuführen zu sein, dass die Abhängigkeit zwischen Zähler und Nenner das Signifikanzniveau gesenkt hat. Wenn Sie die kritischen Werte entsprechend anpassen, würde selbst bei n = 10 wenig zwischen ihnen liegen.
Dies deutet darauf hin, dass bei nicht kleinen Stichprobengrößen nicht allzu viel zwischen ihnen liegt, solange Sie keine sehr kleinen Signifikanzniveaus verwenden müssen.
quelle
quelle