Sollte die Standardabweichung in einem Student-T-Test korrigiert werden?

8

Mit dem Student-T-Test wird T-Critical berechnet über:

t=X¯μ0s/n

Im Wikipedia-Artikel über die unvoreingenommene Schätzung der Standardabweichung finden Sie im Abschnitt Ergebnis für die Normalverteilung einen Korrekturfaktor für die gemessene Standardabweichung s der Stichprobe, basierend auf der Stichprobengröße. Fragen:c4(n)

(1) Ist dieser Korrekturfaktor in den T-Tabellendaten des Schülers enthalten, da er in Freiheitsgraden angegeben ist?

(2) Wenn (1) nein ist, warum nicht?

MaxW
quelle

Antworten:

15

1) Nein, ist es nicht.

2) weil die Berechnung der Verteilung der Teststatistik auf der Verwendung der Quadratwurzel der gewöhnlichen Bessel-korrigierten Varianz beruht, um die Schätzung der Standardabweichung zu erhalten.

Wenn es enthalten wäre, würde es jede t-Statistik - und damit ihre Verteilung - nur um einen Faktor skalieren (einen anderen bei jedem df); das würde dann die kritischen Werte um den gleichen Faktor skalieren.

Wenn Sie möchten, können Sie also eine neue Menge von "t" -Tabellen mit die in der Formel für eine neue Statistik verwendet werden: , multiplizieren Sie dann alle tabellarischen Werte für mit dem entsprechenden , um Tabellen für die neue Statistik zu erhalten. Wir könnten unsere Tests jedoch genauso leicht auf ML-Schätzungen von stützen , die in mehrfacher Hinsicht einfacher wären, aber auch nichts Wesentliches am Testen ändern würden. t * = ¯ X - μ 0s=s/c4tνc4(ν+1)σt=X¯μ0s/n=c4(n)tn1tνc4(ν+1)σ

Eine unverzerrte Schätzung der Populationsstandardabweichung würde die Berechnung nur komplizierter machen und nirgendwo anders etwas speichern (die gleichen , und würden letztendlich immer noch zur gleichen Ablehnung führen oder Nichtzurückweisung). [Zu welchem ​​Ende? Warum wählen Sie nicht stattdessen MLE oder Minimum MSE oder eine beliebige Anzahl anderer Möglichkeiten, um Schätzer für ?] ¯ x 2 nσx¯x2¯nσ

Es ist nichts besonders Wertvolles, eine unvoreingenommene Schätzung von für diesen Zweck zu haben (Unvoreingenommenheit ist eine schöne Sache, andere Dinge sind gleich, aber andere Dinge sind selten gleich).s

Angesichts der Tatsache, dass Menschen daran gewöhnt sind, Bessel-korrigierte Varianzen und damit die entsprechende Standardabweichung zu verwenden, und die daraus resultierenden Nullverteilungen relativ einfach sind, gibt es - wenn überhaupt - wenig zu gewinnen, wenn eine andere Definition verwendet wird.

Glen_b -Reinstate Monica
quelle
1
Danke für die nachdenkliche Antwort. Statistiken über kleine Stichproben sind so ungenau, dass es nicht so aussah, als würde die Korrektur das Problem mit kleinen Stichproben auf magische Weise beheben.
MaxW
1
Entschuldigung, ich bin mir nicht sicher, was Sie dort erreichen. Der Term führt einfach zu einem Schätzer, bei dem bei normaler Abtastung ist. Über welches kleine Beispielproblem sprechen wir (vermutlich, da es sich um den T-Test handelt, gibt es ein Problem mit dem ich verpasst habe?) Und wie wurde es "behoben"? c4E.(σ^)=σt
Glen_b -Reinstate Monica
Tut mir leid, stumpf zu sein. Ich bezog mich auf eine Situation, in der man 3 Messungen vorgenommen und den Mittelwert berechnet hat, std. dev. und 95% Konfidenzintervall basierend auf diesen Daten. Bei einer so kleinen Stichprobe ist das Konfidenzintervall sehr groß. Durch die Korrektur der Standardabweichung wird die Genauigkeit und Präzision einer 3-Schuss-Probe nicht auf magische Weise wesentlich verändert.
MaxW
Ah. Danke, ich verstehe jetzt. Sie haben Recht, dass nichts Magisches passiert; Bei kleinen Stichproben ist das Konfidenzintervall groß, und die Skalierung einer Statistik hat keinerlei Auswirkungen darauf. in der Tat können wir dies formal über die Schlüsselgrößen zeigen, die zur Erstellung der üblichen Konfidenzintervalle verwendet werden.
Glen_b -Reinstate Monica