Bevor ich diese Frage stellte, habe ich unsere Website durchsucht und viele ähnliche Fragen gefunden (wie hier , hier und hier ). Ich bin jedoch der Meinung, dass diese verwandten Fragen nicht gut beantwortet oder diskutiert wurden, und möchte diese Frage daher erneut stellen. Ich denke, es sollte eine große Anzahl von Zuschauern geben, die wünschen, dass diese Art von Fragen klarer erklärt werden.
Betrachten Sie für meine Fragen zunächst das lineare Modell mit gemischten Effekten
Nehmen wir an, der einzige Faktor mit festem Effekt ist eine kategoriale Variable Behandlung mit 3 verschiedenen Ebenen. Und der einzige Zufallseffektfaktor ist die Variable Subject . Wir haben jedoch ein Modell mit gemischten Effekten mit festem Behandlungseffekt und zufälligem Subjekteffekt.
Meine Fragen sind also:
- Gibt es die Homogenität der Varianzannahme in der linearen gemischten Modelleinstellung analog zu herkömmlichen linearen Regressionsmodellen? Wenn ja, was bedeutet die Annahme speziell im Zusammenhang mit dem oben genannten linearen gemischten Modellproblem? Welche anderen wichtigen Annahmen müssen bewertet werden?
Meine Gedanken: JA. Die Annahmen (ich meine, Null-Fehler-Mittelwert und gleiche Varianz) sind immer noch von hier: . In der traditionellen Einstellung des linearen Regressionsmodells können wir sagen, dass die Annahme lautet, dass "die Varianz der Fehler (oder nur die Varianz der abhängigen Variablen) über alle 3 Behandlungsebenen konstant ist". Aber ich bin verloren, wie wir diese Annahme unter dem gemischten Modell erklären können. Sollten wir sagen "die Varianzen sind über 3 Behandlungsebenen konstant, Konditionierung auf Probanden? Oder nicht?"
Die SAS - Online - Dokument über die Rest- und Einfluss Diagnostik brachte zwei verschiedene Residuen, dh die Marginal Residuen , und die Conditional Residuen , Meine Frage ist, wofür werden die beiden Residuen verwendet? Wie könnten wir sie verwenden, um die Homogenitätsannahme zu überprüfen? Für mich können nur die marginalen Residuen verwendet werden, um das Problem der Homogenität anzugehen, da es dem des Modells entspricht. Ist mein Verständnis hier richtig?
Gibt es Tests, die vorgeschlagen werden, um die Homogenitätsannahme unter einem linearen gemischten Modell zu testen? @Kam hat zuvor auf den Levene-Test hingewiesen. Wäre dies der richtige Weg? Wenn nicht, wie lauten die Anweisungen? Ich denke, nachdem wir das gemischte Modell angepasst haben, können wir die Residuen erhalten und vielleicht einige Tests durchführen (wie den Anpassungstest?), Aber wir sind uns nicht sicher, wie es sein würde.
Mir ist auch aufgefallen, dass es in SAS drei Arten von Residuen von Proc Mixed gibt, nämlich das Raw-Residuum , das Studentized-Residuum und das Pearson-Residuum . Ich kann die Unterschiede zwischen ihnen in Formeln verstehen. Aber für mich scheinen sie sehr ähnlich zu sein, wenn es um reale Datenplots geht. Wie sollen sie in der Praxis eingesetzt werden? Gibt es Situationen, in denen ein Typ dem anderen vorgezogen wird?
Für ein Beispiel mit realen Daten stammen die folgenden zwei Restdiagramme von Proc Mixed in SAS. Wie könnte die Annahme der Homogenität von Varianzen von ihnen angegangen werden?
[Ich weiß, ich habe hier ein paar Fragen. Wenn Sie mir Ihre Gedanken zu einer Frage mitteilen könnten, wäre das großartig. Sie müssen nicht alle ansprechen, wenn Sie nicht können. Ich möchte wirklich darüber diskutieren, um ein umfassendes Verständnis zu erhalten. Vielen Dank!]
Hier sind die marginalen (rohen) Restdiagramme.
Hier sind die bedingten (rohen) Restdiagramme.
quelle
Antworten:
Ich denke, Frage 1 und 2 sind miteinander verbunden. Erstens kommt die Homogenität der Varianzannahme von hier, . Diese Annahme kann jedoch auf allgemeinere Varianzstrukturen gelockert werden, bei denen die Homogenitätsannahme nicht erforderlich ist. Das heißt, es hängt wirklich davon ab, wie die Verteilung von angenommen wird.ϵ ∼ N(0,σ2I) ϵ
Zweitens werden die bedingten Residuen verwendet, um die Verteilung von (also alle damit verbundenen Annahmen) zu überprüfen , während die marginalen Residuen verwendet werden können, um die Gesamtvarianzstruktur zu überprüfen.ϵ
quelle
Dies ist ein wirklich breites Thema, und ich werde nur ein allgemeines Bild über den Zusammenhang mit der linearen Standardregression geben.
In dem in der Frage aufgeführten Modell ist wenn , wobei ein Thema oder einen Cluster bezeichnet. Sei . Mit der Cholesky-Zerlegung können wir die Ergebnis- und Entwurfsmatrix transformieren,
Wie in Applied Longitudinal Analysis (Seite 268) erwähnt, kann die Schätzung der verallgemeinerten kleinsten Quadrate (GLS) von (Regression auf ) aus der OLS-Regression von neu geschätzt werden on . Hier kann also die gesamte integrierte Restdiagnose des resultierenden OLS verwendet werden .β yi Xi y∗i X∗i
Was wir tun müssen, ist:
Die OLS-Regression setzt unabhängige Beobachtungen mit homogener Varianz voraus, sodass Standarddiagnosetechniken auf ihre Residuen angewendet werden können.
Weitere Einzelheiten finden Sie in Kapitel 10 "Restanalysen und Diagnostik" des Buches Angewandte Längsschnittanalyse . Sie diskutierten auch die Transformation des Residuums mit , und es gibt einige Diagramme von (transformierten) Residuen (gegen vorhergesagte Werte oder Prädiktoren). Weitere Lesungen sind in 10.8 "Weitere Lesungen" und den darin enthaltenen bibliografischen Anmerkungen aufgeführt.Li
Darüber hinaus können wir meiner Meinung nach unter der Annahme, dass unabhängig und mit homogener Varianz sind, diese Annahmen anhand der Werkzeuge aus der Standardregression an den bedingten Residuen testen.ϵ
quelle