Ist es falsch, ANOVA anstelle eines T-Tests zum Vergleich zweier Mittelwerte zu verwenden?

11

Ich habe eine Verteilung der Gehälter und möchte den Unterschied in den Mitteln für Männer und Frauen vergleichen. Ich weiß, dass es den Schüler-T-Test zum Vergleichen von zwei Mitteln gibt, aber nachdem ich ANOVA vorgeschlagen hatte, erhielt ich einige Kritik, dass ANOVA zum Vergleichen von mehr als zwei Mitteln dient.

Was (wenn überhaupt) ist falsch daran, nur zwei Mittel zu vergleichen?

Pablo Fernandez
quelle
9
Wer sagt, dass es falsch ist?
Gung - Reinstate Monica
1
Warum formulieren Sie die Frage nicht neu, indem Sie Annahmen unterdrücken? Etwas in der Art von "Entspricht ANOVA einem T-Test beim Vergleich zweier Gruppen?" Nur eine Idee ... Ich übernehme keine Verantwortung dafür, wie willkommen die Frage ist :-)
Antoni Parellada
4
Ändern Sie alternativ Ihre Frage, um jemandem zu zeigen, dass er falsch ist ... damit wir erklären können, dass er sich irrt. Die Schwierigkeit hierbei ist, dass die Prämisse der Frage (dass sie falsch ist) falsch ist.
Glen_b -State Monica
1
Obwohl die Prämisse falsch ist, scheint diese Frage nicht vom Thema abzukommen oder so unklar zu sein, dass sie nicht beantwortet werden kann (tatsächlich wurde sie beantwortet). Ich denke, das kann offen bleiben.
Gung - Reinstate Monica
1
Einverstanden, @ gung. Ich denke, die Frage spiegelt einen Mangel an Wissen über das Thema wider. Wenn es anders formuliert (oder "besser") wäre, wäre die Frage wahrscheinlich nicht gestellt worden, weil sie dann die Antwort bereits gewusst hätten.
D_Williams

Antworten:

20

Es ist nicht falsch und entspricht einem Test, bei dem gleiche Abweichungen angenommen werden. Darüber hinaus entspricht sqrt (f-Statistik) bei zwei Gruppen dem (absoluten Wert der) t-Statistik. Ich bin etwas zuversichtlich, dass ein T-Test mit ungleichen Varianzen nicht gleichwertig ist. Da Sie geeignete Schätzungen erhalten können, wenn die Varianzen ungleich sind (Varianzen sind im Allgemeinen immer ungleich einer Dezimalstelle), ist es wahrscheinlich sinnvoll, den t-Test zu verwenden, da er flexibler als eine ANOVA ist (vorausgesetzt, Sie haben nur zwei Gruppen).

Aktualisieren:

Hier ist ein Code, der zeigt, dass die t-Statistik ^ 2 für den t-Test mit gleicher Varianz, aber nicht für den ungleichen t-Test, dieselbe ist wie die f-Statistik.

dat_mtcars <- mtcars

# unequal variance model
 t_unequal <- t.test(mpg ~ factor(vs), data = dat_mtcars)
 t_stat_unequal <-  t_unequal$statistic

# assume equal variance
 t_equal <- t.test(mpg ~ factor(vs), var.equal = TRUE, data = dat_mtcars)
 t_stat_equal <- t_equal$statistic

# anova
 a_equal <- aov(mpg ~ factor(vs), data = dat_mtcars)
 f_stat <- anova(a_equal)
 f_stat$`F value`[1]

# compare by dividing (1 = equivalence)
 (t_stat_unequal^2) / f_stat$`F value`[1] 
 (t_stat_equal^2) / f_stat$`F value`[1] # (t-stat with equal var^2) = F
D_Williams
quelle
3
+1, beachten Sie, dass es möglich ist, einen Einweg-ANOVA / F-Test für ungleiche Varianzen anzupassen (vgl. Alternativen zur Einweg-ANOVA für heteroskedastische Daten ).
Gung - Reinstate Monica
@gung OK. Ich war mir nicht sicher, da ich ANOVA seit einiger Zeit nicht mehr verwendet habe (mache das Bayes'sche Ding).
D_Williams
Die Durchführung von Tests bietet noch einen weiteren Vorteil : Wenn Sie eine Richtungshypothese haben, können Sie eine einseitige durchführentt
4

Sie sind gleichwertig. Eine ANOVA mit nur zwei Gruppen entspricht einem t-Test. Der Unterschied besteht darin, dass bei mehreren Gruppen der Fehler vom Typ I für die t-Tests zunimmt, da Sie die Hypothese nicht gemeinsam testen können. ANOVA leidet nicht unter diesem Problem, da Sie sie gemeinsam durch einen F-Test testen.

robinsa
quelle
1
Ich denke nicht, dass es an Kraft verliert, ich denke, es hat mehr mit den Fehlern des Typs I zu tun. Je mehr Tests Sie haben, desto höher sollte im Allgemeinen die Leistung sein.
HelloWorld
Ich glaube (wie @StudentT sagt), dass es sich um Fehler vom Typ I handelt. In einem Kurs, den ich nehme, bringen sie uns dazu, die "Bonferroni-Korrektur" genau dafür zu verwenden. en.wikipedia.org/wiki/Bonferroni_correction
Pablo Fernandez
Ja, du bist richtig. Es sollte keine Stromversorgung (Typ II) sein, sondern Fehler vom Typ I. Ich glaube, die Argumentation ist richtig, aber aus irgendeinem Grund habe ich Macht geschrieben und keinen Fehler vom Typ 1. Ich werde bearbeiten, um sicherzustellen, dass ich niemanden zum Narren halte.
Robinsa