Verallgemeinerte lineare gemischte Modelle: Diagnose

11

Ich habe eine zufällige logistische Intercept-Regression (aufgrund wiederholter Messungen) und möchte einige Diagnosen durchführen, insbesondere in Bezug auf Ausreißer und einflussreiche Beobachtungen.

Ich habe mir die Residuen angesehen, um festzustellen, ob es Beobachtungen gibt, die auffallen. Ich würde mir aber auch gerne etwas wie Cooks Distanz oder DFFITS ansehen. Hosmer und Lemeshow (2000) sagen, dass aufgrund des Fehlens von Modelldiagnosewerkzeugen für korrelierte Daten nur ein reguläres logistisches Regressionsmodell angepasst werden sollte, wobei die Korrelation ignoriert wird, und die für die reguläre logistische Regression verfügbaren Diagnosewerkzeuge verwendet werden sollten. Sie argumentieren, dass dies besser wäre, als überhaupt keine Diagnose zu stellen.

Das Buch stammt aus dem Jahr 2000 und ich frage mich, ob es jetzt Methoden für die Modelldiagnose mit logistischer Regression mit gemischten Effekten gibt. Was wäre ein guter Ansatz, um nach Ausreißern zu suchen?

Bearbeiten (5. November 2013):

Aufgrund des Mangels an Antworten frage ich mich, ob die Diagnose mit gemischten Modellen im Allgemeinen nicht oder eher kein wichtiger Schritt bei der Modellierung von Daten ist. Lassen Sie mich meine Frage umformulieren: Was tun Sie, wenn Sie ein "gutes" Regressionsmodell gefunden haben?

Emilia
quelle
Mögliches Duplikat einer ähnlichen aktuellen Frage, die ebenfalls nicht so viel Beachtung fand: stats.stackexchange.com/q/70783/442
Henrik
Vielleicht finden Sie meine Antwort auf eine ähnliche Frage hilfreich.
Randel

Antworten:

2

Die diagnostischen Methoden sind in der Tat für verallgemeinerte lineare gemischte Modelle unterschiedlich. Ein vernünftiger, den ich gesehen habe, der auf Residuen eines GLMM basiert, ist Pan und Lin (2005, DOI: 10.1111 / j.1541-0420.2005.00365.x) zu verdanken). Sie haben kumulative Summen von Residuen verwendet, bei denen die Reihenfolge entweder durch die erklärenden Variablen oder durch den linearen Prädiktor vorgegeben ist, wodurch entweder die Spezifikation der Funktionsform eines gegebenen Prädiktors oder die Verknüpfungsfunktion als Ganzes getestet wurde. Die Nullverteilungen basieren auf Simulationen aus dem Entwurfsraum aus der Nullverteilung der korrekten Spezifikationen und zeigten anständige Größen- und Leistungseigenschaften dieses Tests. Sie haben Ausreißer nicht speziell besprochen, aber ich kann mir vorstellen, dass Ausreißer wahrscheinlich zumindest die Verknüpfungsfunktion abschaffen sollten, indem sie zu stark in Richtung der einflussreichen Beobachtung gekrümmt werden.

StasK
quelle
0

Es gibt viele unterschiedliche Meinungen darüber, wie die Diagnose für gemischte Modelle am besten betrachtet werden kann. Im Allgemeinen sollten Sie sowohl die Residuen als auch die Standardaspekte betrachten, die für ein Modell mit nicht wiederholten Messungen untersucht werden.

Darüber hinaus sollten Sie in der Regel auch die zufälligen Effekte selbst betrachten. Zu den Methoden gehört häufig das Auftragen der zufälligen Effekte durch verschiedene Kovariaten und das Suchen nach Nichtnormalität in der Verteilung der zufälligen Effekte. Es gibt viel mehr Methoden (einige davon wurden in den vorherigen Kommentaren erwähnt), aber dies ist normalerweise ein guter Anfang.

Bill Denney
quelle