Ich bin mir sicher, dass ich das komplett um meinen Kopf gewickelt habe, aber ich kann es einfach nicht herausfinden.
Der t-Test vergleicht zwei Normalverteilungen mit der Z-Verteilung. Aus diesem Grund wird bei den DATEN von Normalität ausgegangen.
ANOVA entspricht einer linearen Regression mit Dummy-Variablen und verwendet wie OLS Quadratsummen. Deshalb wird von RESIDUALS die Normalität angenommen.
Ich habe mehrere Jahre gebraucht, aber ich glaube, ich habe diese grundlegenden Fakten endlich begriffen. Warum entspricht der t-Test also einer ANOVA mit zwei Gruppen? Wie können sie gleichwertig sein, wenn sie nicht einmal dasselbe über die Daten annehmen?
distributions
regression
normality-assumption
t-test
anova
Chris Beeley
quelle
quelle
Antworten:
Der t-Test mit zwei Gruppen geht davon aus, dass jede Gruppe normal mit der gleichen Varianz verteilt ist (obwohl sich die Mittelwerte unter der alternativen Hypothese unterscheiden können). Dies entspricht einer Regression mit einer Dummy-Variablen, da sich durch die Regression der Mittelwert jeder Gruppe unterscheiden kann, nicht jedoch die Varianz. Daher haben die Residuen (gleich den Daten mit subtrahierten Gruppenmitteln) die gleiche Verteilung - das heißt, sie sind normalerweise mit dem Mittelwert Null verteilt.
Ein t-Test mit ungleichen Varianzen entspricht nicht einer Einweg-ANOVA.
quelle
Der t-Test ist lediglich ein Sonderfall des F-Tests, bei dem nur zwei Gruppen verglichen werden. Das Ergebnis von beiden ist in Bezug auf den p-Wert genau dasselbe, und es gibt auch eine einfache Beziehung zwischen der F- und der t-Statistik. F = t ^ 2. Die beiden Tests sind algebraisch äquivalent und ihre Annahmen sind dieselben.
Tatsächlich erstrecken sich diese Äquivalenzen auf die gesamte Klasse von ANOVAs, t-Tests und linearen Regressionsmodellen. Der t-Test ist ein Sonderfall der ANOVA. ANOVA ist ein spezieller Regressionsfall. Alle diese Verfahren werden unter dem allgemeinen linearen Modell zusammengefasst und stimmen mit denselben Annahmen überein.
Sie können sich das als Normalität in den Daten vorstellen, aber Sie überprüfen die Normalität in jeder Gruppe. Dies entspricht der Überprüfung der Normalität in den Residuen, wenn der einzige Prädiktor im Modell ein Indikator für die Gruppe ist. Ebenso bei gleichen Abweichungen.
Nebenbei bemerkt, hat R keine separaten Routinen für ANOVA. Die Anova-Funktionen in R sind nur Wrapper für die Funktion lm () - dieselbe Funktion, die auch für lineare Regressionsmodelle verwendet wird -, die etwas anders verpackt sind, um das zu liefern, was normalerweise in einer ANOVA-Zusammenfassung und nicht in einer Regressionszusammenfassung enthalten ist.
quelle
lm()
, wenn Sie nicht mit dem Paketnlme
oder zu gemischten Modellen wechselnlme4
, aber es gibt eine praktische Möglichkeit, wiederholte Messungen durch entsprechende Angabe desError
Begriffs in zu verarbeitenaov()
. Weitere Informationen finden Sie im Baron & Li-Tutorial, §6.9, j.mp/. c5ME4uaov()
baut auf derlm()
Funktion auf, enthält jedoch zusätzliche Argumente, die als Sonderbegriffe bezeichnet werdenError
.Ich stimme Robs Antwort voll und ganz zu, aber lassen Sie es mich anders ausdrücken (mit Wikipedia):
Annahmen ANOVA :
Annahmen t-Test :
Daher würde ich die Frage zurückweisen, da sie offensichtlich die gleichen Annahmen haben (obwohl in einer anderen Reihenfolge :-)).
quelle
Ein offensichtlicher Punkt, den jeder übersehen hat: Mit ANOVA testen Sie die Null, dass der Mittelwert unabhängig von den Werten Ihrer erklärenden Variablen identisch ist. Mit einem T-Test können Sie auch den einseitigen Fall testen, dass der Mittelwert bei einem Wert Ihrer erklärenden Variablen spezifisch größer ist als bei dem anderen.
quelle
Ich werde es vorziehen, t-test zum Vergleichen von zwei Gruppen zu verwenden, und aus Gründen ANOVA für mehr als 2 Gruppen verwenden. Wichtiger Grund ist die Annahme gleicher Varianzen.
quelle