Grundsätzlich frage ich mich, wie unterschiedliche Kovarianzstrukturen erzwungen werden und wie die Werte in diesen Matrizen berechnet werden. Funktionen wie lme () erlauben es uns, die Struktur auszuwählen, die wir möchten, aber ich würde gerne wissen, wie sie geschätzt werden.
Betrachten Sie das lineare Mischeffektmodell .
Wobei und . Außerdem:≤ d ≤ N ( 0 , R )
Der Einfachheit halber nehmen wir .
Grundsätzlich ist meine Frage: Wie genau wird aus den Daten für die verschiedenen Parametrisierungen geschätzt? Sagen wir, wenn wir annehmen, dass diagonal ist (zufällige Effekte sind unabhängig) oder vollständig parametrisiert ist (falls es mich im Moment mehr interessiert) oder eine der verschiedenen anderen Parametrisierungen? Gibt es einfache Schätzer / Gleichungen für diese? (Das wäre zweifellos iterativ geschätzt.)D D
EDIT: Aus dem Buch Variance Components (Searle, Casella, McCulloch 2006) habe ich Folgendes herausgearbeitet:
Wenn ist, werden die Varianzkomponenten wie folgt aktualisiert und berechnet:
Wobei und die ten Aktualisierungen sind. u (k)k
Gibt es allgemeine Formeln, wenn blockdiagonal oder vollständig parametriert ist? Ich vermute, dass im vollständig parametrisierten Fall eine Cholesky-Zerlegung verwendet wird, um eine positive Bestimmtheit und Symmetrie sicherzustellen.
Antworten:
Das mit Goldstein .pdf @probabilityislogic verknüpfte Dokument ist ein großartiges Dokument. Hier ist eine Liste einiger Referenzen, die Ihre spezielle Frage behandeln:
Harville, 1976: Erweiterung des Gauß-Markov-Theorems um die Abschätzung zufälliger Effekte .
Harville, 1977: Maximum-Likelihood-Ansätze zur Varianzkomponentenschätzung und zu verwandten Problemen .
Laird und Ware, 1982: Random-Effects-Modelle für longitudinale Daten .
McCulloch, 1997: Maximum-Likelihood-Algorithmen für verallgemeinerte lineare gemischte Modelle .
Der SAS-Benutzerhandbuch-Auszug für das MIXED-Verfahren enthält einige nützliche Informationen zur Kovarianzschätzung und viele weitere Quellen (ab Seite 3968).
Es gibt zahlreiche Qualitätslehrbücher zur Datenanalyse von Längs- / Wiederholungsmessungen, aber hier ist eines, das einige Details zur Implementierung in R enthält (von den Autoren von
lme4
undnlme
):Pinheiro und Bates, 2000: Mixed-Effects-Modelle in S und S-PLUS .
EDIT : Eine weitere relevante Veröffentlichung: Lindstrom und Bates, 1988: Newton-Raphson- und EM-Algorithmen für lineare Mischeffektmodelle für Messwiederholungsdaten .
EDIT 2 : Und noch eines: Jennrich und Schluchter, 1986: Unausgeglichene Messwiederholungsmodelle mit strukturierten Kovarianzmatrizen .
quelle
lme4
und sehen, wie er mit dieser Schätzung umgeht.Harvey Goldstein ist kein schlechter Ausgangspunkt.
Wie bei den meisten komplexen Schätzmethoden variiert sie mit dem Softwarepaket. Oftmals werden jedoch die folgenden Schritte ausgeführt:
Eine einfache und schnelle Methode ist IGLS, die auf der Iteration zwischen zwei Verfahren der kleinsten Quadrate basiert und in Kapitel 2 ausführlich beschrieben wird. Nachteil ist, dass es für Varianzkomponenten nahe Null nicht gut funktioniert.
quelle
Der folgende Artikel enthält eine Lösung in geschlossener Form für D:
quelle
zwei weitere Referenzen, die nützlich sein könnten Varianzkomponenten von Searle et al. und Lynch and Walsh Genetics and Analysis of Quantitative Traits . Das Lynch- und Walsh-Buch gibt einen schrittweisen Algorithmus, wenn ich mich recht entsinne
quelle