Kann mir jemand sagen, wie ich die Darstellungen "Residuen vs. angepasste", "normale q-q", "Skalenposition" und "Residuen vs. Hebel" interpretieren soll? Ich füge ein binomiales GLM ein, speichere es und zeichne es dann.
30
Kann mir jemand sagen, wie ich die Darstellungen "Residuen vs. angepasste", "normale q-q", "Skalenposition" und "Residuen vs. Hebel" interpretieren soll? Ich füge ein binomiales GLM ein, speichere es und zeichne es dann.
Antworten:
R
hat keine eigeneplot.glm()
Methode. Wenn Sie ein Modell mit anpassenglm()
und ausführenplot()
, wird die Datei? Plot.lm aufgerufen , die für lineare Modelle geeignet ist (dh mit einem normalverteilten Fehlerterm).Im Allgemeinen kann die Bedeutung dieser Plots (zumindest für lineare Modelle) in verschiedenen bestehenden Threads auf CV erlernt werden (zB: Residuen vs. ausgestattet ; qq-Plots an mehreren Stellen: 1 , 2 , 3 , Skala-Location ; Residuen vs Leverage ). Diese Interpretationen sind jedoch nicht allgemein gültig, wenn es sich bei dem fraglichen Modell um eine logistische Regression handelt.
Genauer gesagt, die Handlungen sehen oft "lustig" aus und lassen die Leute glauben, dass etwas mit dem Modell nicht stimmt, wenn es vollkommen in Ordnung ist. Wir können dies sehen, indem wir uns diese Diagramme mit ein paar einfachen Simulationen ansehen, bei denen wir wissen, dass das Modell korrekt ist:
Schauen wir uns nun die Diagramme an, aus denen wir Folgendes erhalten
plot.lm()
:Sowohl das
Residuals vs Fitted
als auch dasScale-Location
Diagramm sehen aus, als ob es Probleme mit dem Modell gibt, aber wir wissen, dass es keine gibt. Diese für lineare Modelle bestimmten Darstellungen sind bei Verwendung eines logistischen Regressionsmodells häufig irreführend.Schauen wir uns ein anderes Beispiel an:
Jetzt sehen alle Handlungen seltsam aus.
Was zeigen Ihnen diese Handlungen?
Residuals vs Fitted
Grundstück kann Ihnen helfen, zu sehen, zum Beispiel, wenn es krummlinigen Trends sind , dass Sie verpasst haben . Die Anpassung einer logistischen Regression ist jedoch von Natur aus krummlinig, sodass Sie bei den Residuen seltsam aussehende Trends feststellen können, ohne dass dies fehlschlägt.Normal Q-Q
Mithilfe des Diagramms können Sie erkennen, ob Ihre Residuen normal verteilt sind. Die Abweichungs-Residuen müssen jedoch nicht normalverteilt sein, damit das Modell gültig ist. Die Normalität / Nicht-Normalität der Residuen sagt also nicht unbedingt etwas aus.Scale-Location
Darstellung kann Ihnen helfen, die Heteroskedastizität zu identifizieren. Aber logistische Regressionsmodelle sind von Natur aus ziemlich heteroskedastisch.Residuals vs Leverage
kann Ihnen helfen, mögliche Ausreißer zu identifizieren. Ausreißer in der logistischen Regression manifestieren sich jedoch nicht notwendigerweise auf die gleiche Weise wie in der linearen Regression. Daher kann diese Darstellung hilfreich sein, um sie zu identifizieren, oder auch nicht.Die einfache Lektion zum Mitnehmen ist, dass es sehr schwierig sein kann, diese Diagramme zu verwenden, um zu verstehen, was mit Ihrem logistischen Regressionsmodell vor sich geht. Es ist wahrscheinlich am besten, wenn die Leute diese Diagramme überhaupt nicht betrachten, wenn sie eine logistische Regression durchführen, es sei denn, sie verfügen über beträchtliches Fachwissen.
quelle
Lesen Sie mehr über Regressionsannahmen, da es in vielen Aspekten ähnliche gibt (z. B. hier oder Tutorial zur Regression in R hier ).
quelle