Warum ist ein T-Test notwendig, da wir den Z-Test haben?

9

Kann jemand erklären, warum der T-Test "passiert"? Mir wurde beigebracht, den T-Test zu verwenden, wenn Sie die Populationsstandardabweichung nicht kennen (dh Sie kennen nur die Standardabweichung Ihrer Stichprobe), aber ich bin mir nicht sicher, warum sich dies von einem Z-Test unterscheidet .

jasonbogd
quelle
Ich habe Ihren Titel aktualisiert, um die Frage zu beantworten, die Sie meiner Meinung nach stellen. Fühlen Sie sich frei zu bearbeiten, wenn ich falsch verstanden habe
Jeromy Anglim

Antworten:

3

Ich glaube nicht, dass ich Ihre Frage vollständig verstehe. Fragen Sie sich, warum Sie einen T-Test verwenden würden?

Wenn Sie verstehen, warum Sie einen Z-Test verwenden würden, sollten Sie eine gute Vorstellung davon haben, warum Sie einen T-Test verwenden würden. Bei großen Proben sollten ein Z-Test und ein T-Test ähnliche oder identische Ergebnisse liefern. Während ein Z-Test eine Normalverteilung annimmt, berücksichtigt ein T-Test die Unsicherheit der Stichprobenverteilung bei kleineren Stichprobengrößen.

Benjamin Mako Hill
quelle
3
Hmm der t-Test geht auch von einer Normalverteilung aus. Vielleicht wollten Sie damit sagen, dass wir weniger Informationen über diese Verteilung benötigen.
JohnK
@JohnK Ich halte es nicht für sinnvoll zu sagen, dass ein Test überhaupt eine Verteilung voraussetzt, aber ich denke, Benjamin meinte, dass der T-Score / die Statistik die T-Verteilung und nicht die Z-Verteilung voraussetzt.
Datoraki
3

Der Z-Test selbst ist tatsächlich ein Likelihood-Ratio-Test zwischen der Wahrscheinlichkeit, die die Nullhypothese annimmt, und der Wahrscheinlichkeit, die die alternative Hypothese annimmt. Unter der Annahme zugrunde liegender Normalverteilungen mit bekannten Varianzen und nur dem Testen der Mittelwerte vereinfacht sich die Algebra zu dem Z-Test, den wir kennen und lieben (DeGroot 1986, S. 442–447).

Wenn Sie dasselbe Maximum-Likelihood-Verfahren verwenden, die Varianz jedoch als unbekannt behandeln, wird ein anderes Paar von Wahrscheinlichkeiten und deren Verhältnis erstellt. Wenn Sie die Algebra vereinfachen, erhalten Sie die Statistik: (DeGroot 1986, S. 485–489). Die fragliche Testverteilung ändert sich ebenfalls, da der Zähler der obigen Statistik normalverteilt ist, , und der Nenner als Quadratwurzel der Quadratnormalen verteilt ist, die , die die Quadratwurzel von a ist Chi-Quadrat-Zufallsvariable. Gosset (Student) hat gezeigt, dass wenn Sie eine Zufallsvariable haben: XS2YN(0,1)

n(X¯nμ0)Sn2n1
X¯S2
YN(0,1)Zχn2XYZn
dann wird X mit der t-Verteilung und n Freiheitsgraden verteilt.

Um es ohne Strenge auszudrücken, ist der t-Test das natürliche Ergebnis desselben Likelihood-Ratio-Prozesses, der hinter dem z-Test steht, wenn die Varianz der Daten selbst unbekannt ist und durch maximale Wahrscheinlichkeit geschätzt wird.

Abraham
quelle
1
das war sehr aufschlussreich. Ich hatte völlig vergessen, dass der T-Test von maximaler Wahrscheinlichkeit kommt
Moderat
1

Die nicht strenge Antwort lautet, dass Sie einen T-Test verwenden möchten, wenn Sie eine kleine Anzahl von Stichproben haben, da die Wahrscheinlichkeit besteht, dass die Stichproben ungewöhnlich nahe beieinander liegen (relativ zur tatsächlichen Populationsvarianz). In diesem Fall ist der Nenner in der Formel für die t-Statistik ungewöhnlich klein, und daher ist die t-Statistik selbst ungewöhnlich groß. Daher ist es viel wahrscheinlicher, dass Sie einen großen Wert für den t-stat erhalten, wenn Sie eine kleine Anzahl von Stichproben haben, als wenn Sie einen vergleichsweise großen z-stat erhalten würden. Daher benötigen Sie einen größeren Wert, um die Null mit abzulehnen der t-Test als der z-Test bei gleichem Signifikanzniveau.

Evan Wright
quelle
Ich finde das Argument ansprechend, aber nach Überlegung nicht überzeugend. Wenn die Stichproben zufällig ungewöhnlich weit voneinander entfernt sind (was genauso leicht passieren sollte wie ungewöhnlich nahe), scheint dieselbe Logik zu der gegenteiligen Schlussfolgerung zu führen.
whuber
0

Das wichtigste Unterscheidungsmerkmal ist als Faustregel die Stichprobengröße: Wenn kleiner als ein t-Test verwendet werden, andernfalls ein z-Test.30n30

Einen guten Überblick über die zugrunde liegenden Annahmen und Unterschiede (und Ähnlichkeiten) beider Tests finden Sie hier:
http://www.le.ac.uk/bl/gat/virtualfc/Stats/ttest.html

vonjd
quelle