Hintergrund
Um Unterschiede in einer kontinuierlichen Variablen zwischen verschiedenen Gruppen zu analysieren (gegeben durch eine kategoriale Variable), kann eine Einweg-ANOVA durchgeführt werden. Wenn es mehrere erklärende (kategoriale) Variablen gibt, kann eine faktorielle ANOVA durchgeführt werden. Wenn man Unterschiede zwischen Gruppen in mehreren kontinuierlichen Variablen (dh mehreren Antwortvariablen) analysieren möchte, muss man eine multivariate ANOVA (MANOVA) durchführen.
Frage
Ich verstehe kaum, wie man einen ANOVA-ähnlichen Test für mehrere Antwortvariablen durchführen kann, und was noch wichtiger ist, ich verstehe nicht, wie die Nullhypothese aussehen könnte. Ist die Nullhypothese:
- "Für jede Antwortvariable sind die Mittelwerte aller Gruppen gleich",
oder ist es
- "Für mindestens eine Antwortvariable sind die Mittelwerte aller Gruppen gleich",
oder ist etwas anderes?
hypothesis-testing
anova
manova
Remi.b
quelle
quelle
H0
von MANOVA ist, dass es keinen Unterschied im multivariaten Raum gibt . Der multivariate Fall ist erheblich komplexer als der univariate, da wir uns mit Kovarianzen befassen müssen, nicht nur mit Varianzen. Es gibt verschiedene Möglichkeiten, dieH0-H1
Hypothesen in MANOVA zu formulieren . Lesen Sie Wikipedia.For each response variable
. Für mich klingt es so (oder ich lese es als) "Testen wird univarietiert an jedem durchgeführt" (und dann irgendwie kombiniert).Antworten:
Die Nullhypothese einer Einweg-ANOVA lautet, dass die Mittelwerte aller Gruppen gleich sind: H 0 : μ 1 = μ 2 = . . . = μ k . Die Nullhypothese H 0 einer Einweg-MANOVA lautet, dass die [multivariaten] Mittelwerte aller Gruppen gleich sind:Dies entspricht der Aussage, dass die Mittelwerte für jede Antwortvariable gleich sind, dh Ihre erste Option ist korrekt .H.0
In beiden Fällen ist die alternative Hypothese die Negation der Null. In beiden Fällen sind die Annahmen (a) Gaußsche gruppeninterne Verteilungen und (b) gleiche Varianzen (für ANOVA) / Kovarianzmatrizen (für MANOVA) über Gruppen hinweg.H.1
Unterschied zwischen MANOVA und ANOVAs
Dies mag etwas verwirrend erscheinen: Die Nullhypothese von MANOVA ist genau die gleiche wie die Kombination von Nullhypothesen für eine Sammlung univariater ANOVAs, aber gleichzeitig wissen wir, dass MANOVA nicht gleichbedeutend mit univariaten ANOVAs ist und dann irgendwie " Kombinieren "der Ergebnisse (man könnte sich verschiedene Kombinationsmöglichkeiten ausdenken). Warum nicht?
Die Antwort ist, dass das Ausführen aller univariaten ANOVAs, obwohl sie dieselbe Nullhypothese testen würden, weniger Leistung hat. Eine Illustration finden Sie in meiner Antwort hier: Wie kann MANOVA einen signifikanten Unterschied melden, wenn keine der univariaten ANOVAs eine Signifikanz erreicht? Eine naive Methode des "Kombinierens" (die globale Null ablehnen, wenn mindestens eine ANOVA die Null ablehnt) würde ebenfalls zu einer enormen Inflation der Typ-I-Fehlerrate führen. Aber selbst wenn man eine intelligente Art des "Kombinierens" wählt, um die richtige Fehlerrate beizubehalten, würde man an Leistung verlieren.
Wie das Testen funktioniert
ANOVA zersetzt sich die Gesamtsumme der Quadrate in zwischen den Gruppen sum-of-Squares und innerhalb der Gruppe sum-of-Squares , so dass . Sie berechnet dann das Verhältnis . Unter der Nullhypothese sollte dieses Verhältnis klein sein (um ); man kann die genaue Verteilung dieses Verhältnisses berechnen, die unter der Nullhypothese erwartet wird (es wird von und von der Anzahl der Gruppen abhängen ). Der Vergleich des beobachteten Wertes mit dieser Verteilung ergibt einen p-Wert.T. B. W. T.= B + W. S / W. 1 n S / W.
MANOVA zersetzt sich die Gesamtstreumatrix in zwischen den Gruppen Streumatrix und innerhalb der Gruppe Streumatrix , so dass . Es berechnet dann die Matrix . Unter der Nullhypothese sollte diese Matrix "klein" sein (um ); aber wie kann man quantifizieren, wie "klein" es ist? MANOVA betrachtet die Eigenwerte dieser Matrix (sie sind alle positiv). Wiederum sollten diese Eigenwerte unter der Nullhypothese "klein" sein (rund um 1)T. B. W. T = B + W. W.- 1B. ich λich 1 ∑ λich max { λich}}
Unterschiedliche Auswahlmöglichkeiten der Teststatistik führen zu geringfügig unterschiedlichen p-Werten. Es ist jedoch wichtig zu wissen, dass jeweils dieselbe Nullhypothese getestet wird.
quelle
SSdifference/SSerror
. In MANOVA ist der multivariate EffektSSCPerror^(-1)SSCPdifference
Matrix (Kovarianzen insgesamt und innerhalb von Gruppen berücksichtigt). Da es jedoch mehrere Eigenwerte gibt, die in einer Teststatistik nicht auf eine einzige Weise "kombiniert" werden könnten, existieren mehrere mögliche alternative Hypothesen. Mehr Leistung - mehr theoretische Komplexität.Es ist das erstere.
Die Art und Weise, wie dies geschieht, ist jedoch nicht wörtlich, die Mittelwerte der einzelnen Originalvariablen nacheinander zu vergleichen. Stattdessen werden die Antwortvariablen auf eine Weise linear transformiert, die der Hauptkomponentenanalyse sehr ähnlich ist . (PCA hat hier einen ausgezeichneten Thread: Sinnvolle Hauptkomponentenanalyse, Eigenvektoren und Eigenwerte .) Der Unterschied besteht darin, dass PCA Ihre Achsen so ausrichtet, dass sie mit den Richtungen maximaler Variation ausgerichtet sind, während MANOVA Ihre Achsen in die Richtungen dreht, in denen Maximieren Sie die Trennung Ihrer Gruppen.
Um klar zu sein, testet keiner der mit einer MANOVA verbundenen Tests alle Mittel nacheinander in direktem Sinne, entweder mit den Mitteln im ursprünglichen Raum oder im transformierten Raum. Es gibt verschiedene Teststatistiken, die jeweils etwas anders funktionieren. Sie tendieren jedoch dazu, über die Eigenwerte der Zerlegung zu operieren, die den Raum transformiert. Was die Art der Nullhypothese betrifft, so ist es so, dass alle Mittelwerte aller Gruppen für jede Antwortvariable gleich sind, nicht dass sie sich bei einigen Variablen unterscheiden können, sondern bei mindestens einer.
quelle