Wiederholte Messungen ANOVA: Wie lautet die Normalitätsannahme?

15

Ich bin verwirrt über die Normalitätsannahme bei ANOVA mit wiederholten Messungen. Insbesondere frage ich mich, welche Art von Normalität genau erfüllt sein sollte. Beim Lesen der Literatur und der Antworten zum Lebenslauf bin ich auf drei unterschiedliche Formulierungen dieser Annahme gestoßen.

  1. Die abhängige Variable innerhalb jeder (wiederholten) Bedingung sollte normal verteilt werden.

    Es wird oft behauptet, dass die RANOVA die gleichen Annahmen wie die ANOVA hat, zuzüglich der Sphärizität. Das ist die Behauptung in der Entdeckungsstatistik von Field sowie im Wikipedia- Artikel zu diesem Thema und in Lowrys Text .

  2. Die Residuen (Differenzen zwischen allen möglichen Paaren?) Sollten normal verteilt sein.

    Ich fand diese Aussage in mehreren Antworten im Lebenslauf ( 1 , 2 ). In Analogie von rANOVA zum gepaarten t-Test mag dies auch intuitiv erscheinen.

  3. Multivariate Normalität sollte erfüllt sein.

    Wikipedia und diese Quelle erwähnen dies. Ich weiß auch, dass RANOVA mit MANOVA getauscht werden kann, was diese Behauptung möglicherweise verdient.

Sind diese irgendwie gleichwertig? Ich weiß, dass multivariate Normalität bedeutet, dass jede Linearkombination der DVs normalverteilt ist, also würde 3. natürlich 2. einschließen, wenn ich letzteres richtig verstehe.

Wenn diese nicht gleich sind, welche ist die "wahre" Annahme der RANOVA? Können Sie eine Referenz angeben?

Mir scheint, es gibt die größte Unterstützung für die erste Behauptung. Dies steht jedoch nicht im Einklang mit den Antworten, die normalerweise hier gegeben werden.


Linear gemischte Modelle

Aufgrund des @ utobi-Hinweises verstehe ich jetzt, wie sich rANOVA als lineares gemischtes Modell umschreiben lässt. Genauer gesagt, modellieren , wie der Blutdruck mit der Zeit ändert, würde ich den erwarteten Wert modelliert als: wobei y i j Messungen von Blutdruck, ein i das durchschnittliche Blut Druck des i -ten Subjekts und t i j als - te Mal , wenn das gemessen wurde -te Subjekt,

E[yij]=ai+bitij,
yijaiitiji b ijibiDies bedeutet, dass die Änderung des Blutdrucks auch von Thema zu Thema unterschiedlich ist. Beide Effekte werden als zufällig angesehen, da die Stichprobe der Probanden nur eine zufällige Teilmenge der Bevölkerung ist, die von primärem Interesse ist.

Schließlich habe ich versucht zu überlegen, was dies für die Normalität bedeutet, aber zu wenig Erfolg. Um McCulloch und Searle (2001, S. 35. Gleichung (2.14)) zu paraphrasieren:

E[yij|ai]=aiyij|aiindep. N(ai,σ2)aii.i.d. N(a,σa2)

Ich verstehe das so

4. Die Daten jedes Einzelnen müssen normal verteilt sein, dies ist jedoch nicht zumutbar, um mit wenigen Zeitpunkten getestet zu werden.

Ich nehme den dritten Ausdruck, um das zu bedeuten

5. Die Durchschnittswerte der einzelnen Fächer sind normalerweise verteilt. Beachten Sie, dass dies zusätzlich zu den drei oben genannten zwei weitere Möglichkeiten sind.


McCulloch, CE & Searle, SR (2001). Generalisierte, lineare und gemischte Modelle . New York: John Wiley & Sons, Inc.

Fato39
quelle
Nur um dir einen Hinweis zu geben. Sie können das rANOVA-Modell als lineares gemischtes Modell (LMM) angeben. Sobald Sie ein LMM haben, sehen Sie sofort die implizierte Normalitätsannahme. Siehe hier ( eu.wiley.com/WileyCDA/WileyTitle/productCd-0470073713.html ) für eine Theorie der LMMs
Utobi
Vielen Dank, @utobi, für den Hinweis, den Sie zur Verfügung gestellt haben! In der Tat habe ich die ersten Kapitel studiert, aber es ist mir nicht gelungen, die Antwort auf meine Frage zu finden. Ich habe es aktualisiert, um die begrenzten Fortschritte widerzuspiegeln, die ich gemacht habe.
Fato39
3
Das scheint mir eine sehr gute Frage zu sein. Ich stimme dafür, offen zu lassen.
gung - Wiedereinsetzung von Monica
Richtig, die Daten jedes Einzelnen müssen normal verteilt sein. Wenn Sie sich jedoch ansehen, was Sie geschrieben haben, werden alle einzelnen Daten nach der Herabstufung ( wird abgezogen), einen Mittelwert von Null und die gleiche Varianz ( σ 2 a ). Sie können also davon ausgehen, dass alle herabgesetzten Daten aus einer einzigen Normalverteilung stammen. Sie können sich Residuen ansehen, um zu sehen, wie gut diese Annahme erfüllt ist. aiσa2
Heteroskedastic Jim

Antworten:

2

Dies ist das einfachste ANOVA-Modell mit wiederholten Messungen, wenn wir es als univariates Modell behandeln:

yit=ai+bt+ϵit

Dabei steht für jeden Fall und t für die Zeiten, zu denen wir sie gemessen haben (die Daten sind also in Langform). y i tityitaibtϵit

aiFb1=...=bt=0

F

ϵitN(0,σ)these errors are normally distributed and homoskedastic

F

Wenn Sie die ANOVA mit wiederholten Messungen als multivariates Modell behandeln möchten, können die Normalitätsannahmen unterschiedlich sein, und ich kann sie nicht über das hinaus erweitern, was Sie und ich bei Wikipedia gesehen haben.

Heteroskedastic Jim
quelle
0

Die Erklärung der Normalität der ANOVA mit wiederholten Messungen finden Sie hier:

Grundlegendes zu ANOVA-Annahmen für wiederholte Messungen zur korrekten Interpretation der SPSS-Ausgabe


31325

Federico Tedeschi
quelle
2
Federico, danke für deine Antwort. Mir war diese Erklärung bekannt (siehe Punkt 2 und den ersten dort angegebenen Lebenslauf). Obwohl ich die Qualität der Antworten im Lebenslauf schätze, habe ich bei der Abfrage verschiedener Quellen unterschiedliche (widersprüchliche?) Antworten auf meine Frage erhalten. Ich würde daher eine Quelle bevorzugen, die ausdrücklich oder endgültig auf die in meinen fünf vorstehenden Punkten erwähnten Nuancen eingeht.
Fato39