Warum nimmt ANOVA mit wiederholten Messungen die Sphärizität an?

10

Warum nimmt ANOVA mit wiederholten Messungen die Sphärizität an?

Mit Sphärizität meine ich die Annahme, dass die Varianz aller paarweisen Unterschiede zwischen Gruppen gleich sein sollte.

Insbesondere verstehe ich nicht, warum dies die Annahme sein sollte und nicht, dass die Varianzen der beobachteten Gruppenwerte selbst gleich sind.

user1205901 - Monica wiederherstellen
quelle
1
Wie ich hier kommentiert habe , impliziert die Sphärizität, dass die Differenzvariablen zwischen den RM-Niveaus aufgrund ihres Ursprungs gebunden sind, dass sie dieselben Varianzen aufweisen.
ttnphns
1
Bevor Sie antworten, ist es hilfreich zu wissen, ob Sie verstehen, warum unabhängige Maßnahmen ANOVA eine Homogenität der Varianz voraussetzt.
John
@ John Mein Verständnis ist, dass diese Antwort unter stats.stackexchange.com/questions/81914/… diese Frage richtig beantwortet.
user1205901
@ttnphns Leider verstehe ich deine Antwort nicht ganz. Wären Sie oder ein anderes Poster daran interessiert, eine detailliertere Antwort zu erhalten?
user1205901

Antworten:

2

Intuition hinter der Annahme der Sphärizität

Als eine der Annahmen gemeinsamer, nicht wiederholter Messungen ist ANOVA die gleiche Varianz in allen Gruppen.

(Wir können es verstehen, weil gleiche Varianz, auch als Homoskedastizität bekannt , erforderlich ist, damit der OLS-Schätzer in der linearen Regression BLAU ist und die entsprechenden t-Tests gültig sind, siehe Gauß-Markov-Theorem . Und ANOVA kann als linear implementiert werden Regression.)

Versuchen wir also, den RM-ANOVA-Fall auf den Nicht-RM-Fall zu reduzieren. Der Einfachheit halber werde ich mich mit einer Ein-Faktor-RM-ANOVA (ohne Zwischensubjekteffekte) befassen, bei der Subjekte unter RM-Bedingungen aufgezeichnet wurden .knk

Jedes Subjekt kann einen eigenen fachspezifischen Versatz oder Schnitt haben. Wenn wir Werte in einer Gruppe von Werten in allen anderen Gruppen subtrahieren, werden wir diese Abschnitte aufheben und zu der Situation gelangen, in der wir Nicht-RM-ANOVA verwenden können, um zu testen, ob diese Gruppendifferenzen alle Null sind. Damit dieser Test gültig ist, müssen wir die Annahme gleicher Varianzen dieser Differenzen annehmen.k - 1k1k1

Jetzt können wir Gruppe 2 von allen anderen Gruppen subtrahieren und wieder zu Unterschieden gelangen, die ebenfalls gleiche Varianzen haben sollten. Für jede Gruppe von sollten die Varianzen der entsprechenden Differenzen gleich sein. Daraus folgt schnell, dass alle möglichen Unterschiede von gleich sein sollten.k k - 1 k ( k - 1 ) / 2k1kk1k(k1)/2

Welches ist genau die Sphärizitätsannahme.

Warum sollten Gruppenabweichungen nicht gleich sein?

Wenn wir an RM-ANOVA denken, denken wir normalerweise an ein einfaches additives Modell im gemischten Modellstil der Form wobei Subjekteffekte sind. sind Bedingungseffekte und .α i β j ϵ N ( 0 , σ 2 )

yij=μ+αi+βj+ϵij,
αiβjϵN(0,σ2)

Für dieses Modell folgen Gruppenunterschiede , dh alle haben die gleiche Varianz , sodass die Sphärizität gilt. Aber jede Gruppe folgt einer Mischung von Gaußschen mit Mitteln bei und Varianzen , was eine komplizierte Verteilung mit Varianz ist, die über Gruppen hinweg konstant ist.N(βj1βj2,2σ2)2σ2nαiσ2V(α,σ2)

In diesem Modell sind also auch die Gruppenvarianzen gleich. Gruppenkovarianzen sind ebenfalls gleich, was bedeutet, dass dieses Modell eine zusammengesetzte Symmetrie impliziert . Dies ist im Vergleich zur Sphärizität eine strengere Bedingung. Wie mein intuitives Argument oben zeigt, kann RM-ANOVA in der allgemeineren Situation gut funktionieren, wenn das oben beschriebene additive Modell nicht gilt .

Präzise mathematische Aussage

Ich werde hier etwas aus den BedingungenF von Huynh & Feldt, 1970, hinzufügen , unter denen mittlere quadratische Verhältnisse in Designs mit wiederholten Messungen genaue Verteilungen haben .

Was passiert, wenn die Sphärizität bricht?

Wenn die Sphärizität nicht anhält, können wir wahrscheinlich erwarten, dass RM-ANOVA (i) eine aufgeblasene Größe hat (mehr Fehler vom Typ I), (ii) eine verringerte Leistung hat (mehr Fehler vom Typ II). Man kann dies durch Simulationen untersuchen, aber ich werde es hier nicht tun.

Amöbe sagt Reinstate Monica
quelle
4

Es stellt sich heraus, dass der Effekt der Verletzung der Sphärizität ein Leistungsverlust (dh eine erhöhte Wahrscheinlichkeit eines Fehlers vom Typ II) und eine Teststatistik (F-Verhältnis) ist, die einfach nicht mit tabellarischen Werten der F-Verteilung verglichen werden kann. Der F-Test wird zu liberal (dh der Anteil der Ablehnungen der Nullhypothese ist größer als das Alpha-Niveau, wenn die Nullhypothese wahr ist.

Eine genaue Untersuchung dieses Themas ist sehr aufwändig, aber glücklicherweise haben Box et al. Einen Artikel darüber geschrieben: https://projecteuclid.org/download/pdf_1/euclid.aoms/1177728786

Kurz gesagt ist die Situation wie folgt. Nehmen wir zunächst an, wir haben einen Faktor für wiederholte Messungen mit S Probanden und A experimentellen Behandlungen. In diesem Fall wird der Effekt der unabhängigen Variablen durch Berechnung der F-Statistik getestet, die als Verhältnis des mittleren Effektquadrats zum mittleren Quadrat berechnet wird der Wechselwirkung zwischen dem Subjektfaktor und der unabhängigen Variablen. Wenn die Sphärizität gilt, hat diese Statistik eine Fisher-Verteilung mit und Freiheitsgraden.υ1=A1υ2=(A1)(S1)

Im obigen Artikel enthüllte Box, dass, wenn die Sphärizität versagt, die korrekte Anzahl von Freiheitsgraden des F-Verhältnisses von einer Sphärizität wie abhängt : υ1ϵ

υ1=ϵ(A1)
υ2=ϵ(A1)(S1)

Außerdem führte Box den Sphärizitätsindex ein, der für die Populationskovarianzmatrix gilt . Wenn wir die Einträge dieser AxA-Tabelle aufrufen, lautet der Indexξa,a

ϵ=(aξa,a)2(A1)a,aξa,a2

Der Box-Index der Sphärizität lässt sich am besten in Bezug auf die Eigenwerte einer Kovarianzmatrix verstehen. Denken Sie daran, dass Kovarianzmatrizen zur Klasse der positiven semidefiniten Matrizen gehören und daher immer positive Null-Eigenwerte haben. Somit ist die Sphärizitätsbedingung äquivalent dazu, dass alle Eigenwerte gleich einer Konstanten sind.

Wenn also die Sphärizität verletzt wird, sollten wir einige Korrekturen für unsere F-Statistik vornehmen. Die bemerkenswertesten Beispiele für diese Korrekturen sind beispielsweise Greenhouse-Geisser und Huynh-Feldt

Ohne Korrekturen sind Ihre Ergebnisse voreingenommen und daher unzuverlässig. Hoffe das hilft!

Riesiger Akademiker
quelle
+1. Ich werde später mehr dazu sagen, aber im Moment mischt Ihr erster Absatz die Leistung und die Größe des Tests. Was ist beeinträchtigt, wenn die Sphärizität verletzt wird? Die Typ I Fehlerrate unter der Null? Oder die Kraft? Oder beides? Sie meinen wahrscheinlich beides, aber die Formulierung ist nicht sehr klar (glaube ich). Es ist auch nicht "Box et al", es ist Box allein :)
Amöbe sagt Reinstate Monica
Ich denke, die Leistung wird größtenteils beeinträchtigt, denn wie Box gezeigt hat, müssen wir uns bei einer Verletzung der Sphärizität auf eine völlig andere Statistik (mit anderen Freiheitsgraden) verlassen. Wenn wir uns nicht darauf verlassen, werden wir je nachdem, wie stark unsere Verletzung ist, einen größeren Anteil an Ablehnungen der Nullhypothese haben.
Großer Akademiker
Entschuldigung, immer noch verwirrt, jetzt durch Ihren Kommentar: "größerer Anteil der Ablehnungen der Null" - Sie meinen, wann die Null tatsächlich wahr ist? Dies hat jedoch nichts mit der Leistung zu tun. Dies ist die Fehlerrate vom Typ I.
Amöbe sagt Reinstate Monica
+10. Ich vergebe mein Kopfgeld für diese Antwort: Es ist gut und es ist auch die einzige Antwort, die in der Kopfgeldperiode aufgetaucht ist. Ich bin (noch?) Nicht ganz zufrieden mit Ihrer Antwort und habe angefangen, meine eigene Antwort zu schreiben (derzeit unvollständig, aber bereits veröffentlicht), aber ich habe nur ein teilweises Verständnis der zugrunde liegenden Mathematik. Ihre Antwort hat definitiv geholfen und der Verweis auf Box 1954 ist auch sehr hilfreich.
Amöbe sagt Reinstate Monica
Einige weitere verwirrende Momente. (1) Wo führt Box den Sphärizitätsindex in diesem Artikel ein? Ich sehe es überhaupt nicht. Die Formel für wird in diesem nicht angezeigt. (2) Sind Sie sicher, dass s in dieser Formel die Eigenwerte der Kovarianzmatrix sind? Ich denke nicht, dass es wahr ist: Wenn diese Matrix die "Sphärizitätsbedingung" von RM-ANOVA erfüllt, müssen ihre Eigenwerte nicht gleich sein. ϵϵξA×A
Amöbe sagt Reinstate Monica
1

Ich werde versuchen, diese Frage in einer einfachen Einstellung von ANOVA mit wiederholten Maßnahmen zu beantworten. Das Konzept ähnelt der Antwort von @amoeba, mit einer hoffentlich grundlegenderen Darstellung. Angenommen, eine Gruppe von Probanden wird gleichmäßig in verschiedene Gruppen eingeteilt und jedes Subjekt wird gleich oft gemessen. Dies ist ein Split-Plot-Design mit Subjekten als Gesamtplot und Messungen innerhalb jedes Subjekts als Beobachtungen von Unterplots. Bezeichne als die Messung zum k-ten Zeitpunkt des j-ten Subjekts aus der i-ten Gruppe,yijki=1,...,I;j=1,...,J;k=1,...,K.

Der Stichprobenmittelwert der i-ten Gruppe beträgt

y¯i..=1JKj=1Jk=1Kyijk

und das des ij-ten Subjekts ist

y¯ij.=1Kk=1Kyijk

Durch die Annahme der Unabhängigkeit zwischen Subjekten ist die Varianz der Differenz zwischen zwei Gruppenmitteln

Var(y¯i..y¯i..)=1J2j=1JVar(y¯ij.)+1J2j=1JVar(y¯ij.)

Es ist zu erwarten, dass wiederholte Messungen innerhalb eines Subjekts korreliert sind. So, Ist nicht so einfach wie mit die Varianz von jeder Beobachtung ist. Unabhängig davon, ob Für alle Probanden als konstant angenommen wird, kann ein "direkter" 2-Stichproben-T-Test gültig durchgeführt werden, um 2 Gruppenmittelwerte zu vergleichen. Eine Motivation, konstante Varianzen anzunehmen, ist daher die Durchführung eines gültigen und einfachen t-Tests. Var(y¯ij.)σ2/Kσ2Var(y¯ij.)

Nun zu der aufgeworfenen Frage nach der Sphärizität.

Es kann interessant sein, Stichprobenmittelwerte zwischen zwei beliebigen Zeitpunkten mit , wobei Dieser Vergleich erfordert das Ermitteln der Varianz der paarweisen Differenz zwischen und über alle Probanden hinweg. Insbesondere unter der üblichen Annahme der Unabhängigkeit zwischen den Subjekten,y¯..ky¯..k

y¯..k=1IJi=1Ij=1Jyijk.
yijkyijk

Var(y¯..ky¯..k)=1(IJ)2i=1Ij=1JVar(yijkyijk)

Unter der Annahme einer konstanten Varianz aller paarweisen Differenzen ist es daher gültig, einen t-Test durchzuführen, sobald die gemeinsame Varianz geschätzt ist. Diese Annahme impliziert zusammen mit der konstanten Varianz jeder Beobachtung, dass die Kovarianz zwischen jedem Messpaar über alle Paare hinweg konstant ist - Sergiohat einen tollen Beitrag zu diesem Thema. Die Annahmen ergeben daher eine Varianz-Kovarianz-Struktur für wiederholte Messungen jedes Subjekts als Matrix mit einer Konstanten diagonal und einer anderen Konstante außerhalb der Diagonale. Wenn die Einträge außerhalb der Diagonale alle Null sind, reduziert sich dies auf das vollständig unabhängige Modell (was für viele wiederholte Messstudien ungeeignet sein könnte). Wenn die Einträge außerhalb der Diagonale mit denen in der Diagonale identisch sind, sind wiederholte Messungen für ein Subjekt perfekt korreliert, was bedeutet, dass jede einzelne Messung so gut ist wie alle Messungen für jedes Subjekt. Schlussbemerkung - Wenn in unserem einfachen Split-Plot-Design K = 2 ist, ist die Sphärizitätsbedingung automatisch erfüllt.

T Lin
quelle