Wie kann man testen, ob sich eine Kovarianzmatrix über zwei Zeitpunkte geändert hat?

13

Meine Aufgabe ist es zu testen, ob sich die Kovarianzmatrix von 6 Variablen ändert. Werte von 6 Variablen werden zweimal von denselben Probanden gemessen (3 Jahre zwischen den Messungen).

Wie kann ich das machen? Ich habe den größten Teil meiner Arbeit mit SAS gemacht.

Janne
quelle
Danke für deine Antworten. Ich dachte an Box M, war mir aber nicht sicher, ob es sich auf wiederholte Maßnahmen bezieht. Ich musste das Buch von Rencher holen. Ich bin mir ziemlich sicher, dass der Vergleich verschachtelter Modelle zum Beispiel auch für gemischte SAS-Prozesse verwendet werden kann. Trotzdem danke! Ich bin neu hier und hoffentlich kann ich eines Tages auch einige Antworten geben: o)
Janne
Willkommen auf der Seite! Vielen Dank, aber in dieser Site sollten Sie sie nicht als Antwort geben. Sie können Ihre Dankbarkeit zum Ausdruck bringen, indem Sie die Antworten, die Sie mögen, positiv bewerten und diejenige akzeptieren, die Ihnen am besten gefallen hat. Sie können der Antwort auch einen Kommentar hinzufügen. Es ist auch hilfreich, wenn Sie die Frage stellen, welche Dinge, die Sie ausprobiert haben oder die Sie für hilfreich halten, um das Problem zu lösen.
mpiktas

Antworten:

11

Angenommen, Ihre Verteilungen sind multivariate Normalverteilungen (da die Tests für Kovarianzmatrizen sowieso davon ausgehen), lautet Ihre Nullhypothese, dass sich die beiden Populationen nur durch Verschiebung unterscheiden. Sie können dies mit einem Kolmogorov-Smirnov-Test an den beiden Datengruppen testen, von denen ihre Mittelwerte abgezogen wurden.

Rencher (2002) (Abschnitt 7.3.2) liefert die Likelihood-Ratio-Teststatistik für den Vergleich zweier Matrizen (Box-M-Test) wie folgt:

M=|S1|ν1/2|S2|ν2/2/|Sp|(ν1+ν2)/2

S1S2Spν1ν2-2LogMχ2p(p+1)/2pF-Annäherung. Dies ist jedoch eher ein Test mit zwei Stichproben als der Test mit wiederholten Messungen, weshalb er möglicherweise etwas konservativ ist.

StasK
quelle
8

Sie könnten eine Software zur Modellierung von Strukturgleichungen verwenden. Dies ist eine Skizze, wie der Prozess in Amos funktionieren könnte:

  • Addiere alle Variablen für Zeit 1 (X1,...,X6) und Zeit 2 (Y.1,...,Y.6)
  • Zeichnen Sie doppelköpfige Pfeile zwischen allen Variablen (dh Sie lassen die Software wissen, dass alle Varianzen und Kovarianzen frei variieren können, und daher sollte Ihr Modell Daten perfekt darstellen).
  • Nennen Sie alle Varianzen und Kovarianzen
  • Das Obige ist Modell 1 (dh keine Gleichheitsbeschränkungen)
  • Fügen Sie dann Gleichheitserklärungen zu Modell 2 hinzu (dh Varianzen und Kovarianzen sind eingeschränkt).
    • Gleiche Varianzen für entsprechende Variablen zu verschiedenen Zeitpunkten: zB var_x1 = var_y1 var_x2 = var_y2und so weiter
    • gleiche Kovarianzen für entsprechende Zeitpunkte: zB cov_x1_x2 = cov_y1_y2 cov_x1_x3 = cov_y1_y3und so weiter
  • Untersuchen Sie den Unterschied in der Passform zwischen den beiden Modellen
    • Modell 2 ist in Modell 1 verschachtelt, daher sollten Sie in der Lage sein, Vergleichstests für verschachtelte Modelle wie Chi-Quadrat-Differenztests zu verwenden.
Jeromy Anglim
quelle
2

Dies kann wahrscheinlich mit proc mixed getestet werden (naja man muss multivariate Normalität annehmen). Stapeln Sie alle Daten in einer Spalte. Sie benötigen dann Indikatoren für die Betreff-ID und für den Zeitpunkt. Sie müssen sowohl die Betreff-ID als auch den Zeitpunkt als Klassenvariablen definieren. Passen Sie ein Intercept Only-Modell an. Verwenden Sie dann möglicherweise eine wiederholte Anweisung, um eine uneingeschränkte Varianz / Kovarianz-Struktur anzupassen ( type=un). Schreiben Sie die-2ln(L) wo List die Wahrscheinlichkeit) und die Freiheitsgrade. Passen Sie dann ein zweites Modell an. Verwenden Sie diesmal in der wiederholten Anweisung die group=Option, um SASseparate Kovarianzstrukturen für jeden Zeitpunkt anzupassen (dh jeder Zeitpunkt ist eine Gruppe). Schreiben Sie die-2ln(L)und df. Führen Sie dann den LRT-Test ohne Anpassungsunterschied aus, indem Sie den Unterschied zwischen -2 loglikelihoods und dfs zwischen den beiden Modellen verwenden, der unter der Nullhypothese ohne Anpassungsunterschied zwischen den beiden Modellen im Chi-Quadrat verteilt werden sollte.

Andres
quelle
Willkommen auf der Seite von @Andres. Hier können Sie LaTeX verwenden. Ich habe das in deinem Beitrag getan, um es ein bisschen ordentlicher zu machen.
Peter Flom - Wiedereinsetzung von Monica