Kann jemand erklären, warum der T-Test "passiert"? Mir wurde beigebracht, den T-Test zu verwenden, wenn Sie die Populationsstandardabweichung nicht kennen (dh Sie kennen nur die Standardabweichung Ihrer Stichprobe), aber ich bin mir nicht sicher, warum sich dies von einem Z-Test unterscheidet .
hypothesis-testing
t-test
jasonbogd
quelle
quelle
Antworten:
Ich glaube nicht, dass ich Ihre Frage vollständig verstehe. Fragen Sie sich, warum Sie einen T-Test verwenden würden?
Wenn Sie verstehen, warum Sie einen Z-Test verwenden würden, sollten Sie eine gute Vorstellung davon haben, warum Sie einen T-Test verwenden würden. Bei großen Proben sollten ein Z-Test und ein T-Test ähnliche oder identische Ergebnisse liefern. Während ein Z-Test eine Normalverteilung annimmt, berücksichtigt ein T-Test die Unsicherheit der Stichprobenverteilung bei kleineren Stichprobengrößen.
quelle
Der Z-Test selbst ist tatsächlich ein Likelihood-Ratio-Test zwischen der Wahrscheinlichkeit, die die Nullhypothese annimmt, und der Wahrscheinlichkeit, die die alternative Hypothese annimmt. Unter der Annahme zugrunde liegender Normalverteilungen mit bekannten Varianzen und nur dem Testen der Mittelwerte vereinfacht sich die Algebra zu dem Z-Test, den wir kennen und lieben (DeGroot 1986, S. 442–447).
Wenn Sie dasselbe Maximum-Likelihood-Verfahren verwenden, die Varianz jedoch als unbekannt behandeln, wird ein anderes Paar von Wahrscheinlichkeiten und deren Verhältnis erstellt. Wenn Sie die Algebra vereinfachen, erhalten Sie die Statistik: (DeGroot 1986, S. 485–489). Die fragliche Testverteilung ändert sich ebenfalls, da der Zähler der obigen Statistik normalverteilt ist, , und der Nenner als Quadratwurzel der Quadratnormalen verteilt ist, die , die die Quadratwurzel von a ist Chi-Quadrat-Zufallsvariable. Gosset (Student) hat gezeigt, dass wenn Sie eine Zufallsvariable haben: ≤XS2Y≤N(0,1)
Um es ohne Strenge auszudrücken, ist der t-Test das natürliche Ergebnis desselben Likelihood-Ratio-Prozesses, der hinter dem z-Test steht, wenn die Varianz der Daten selbst unbekannt ist und durch maximale Wahrscheinlichkeit geschätzt wird.
quelle
Die nicht strenge Antwort lautet, dass Sie einen T-Test verwenden möchten, wenn Sie eine kleine Anzahl von Stichproben haben, da die Wahrscheinlichkeit besteht, dass die Stichproben ungewöhnlich nahe beieinander liegen (relativ zur tatsächlichen Populationsvarianz). In diesem Fall ist der Nenner in der Formel für die t-Statistik ungewöhnlich klein, und daher ist die t-Statistik selbst ungewöhnlich groß. Daher ist es viel wahrscheinlicher, dass Sie einen großen Wert für den t-stat erhalten, wenn Sie eine kleine Anzahl von Stichproben haben, als wenn Sie einen vergleichsweise großen z-stat erhalten würden. Daher benötigen Sie einen größeren Wert, um die Null mit abzulehnen der t-Test als der z-Test bei gleichem Signifikanzniveau.
quelle
Das wichtigste Unterscheidungsmerkmal ist als Faustregel die Stichprobengröße: Wenn kleiner als ein t-Test verwendet werden, andernfalls ein z-Test.30n 30
Einen guten Überblick über die zugrunde liegenden Annahmen und Unterschiede (und Ähnlichkeiten) beider Tests finden Sie hier:
http://www.le.ac.uk/bl/gat/virtualfc/Stats/ttest.html
quelle