Diagnose für logistische Regression?

74

Bei der linearen Regression können wir die Diagnosediagramme (Residuendiagramme, normale QQ-Diagramme usw.) überprüfen, um zu überprüfen, ob die Annahmen der linearen Regression verletzt werden.

Bei der logistischen Regression habe ich Probleme, Ressourcen zu finden, die erläutern, wie die Anpassung des logistischen Regressionsmodells diagnostiziert wird. In einigen Kursnotizen zu GLM wird lediglich angegeben, dass die Überprüfung der Residuen für die Diagnose einer logistischen Regressionsanpassung nicht hilfreich ist.

Im Internet scheint es auch verschiedene "Diagnose" -Verfahren zu geben, z. B. das Überprüfen der Modellabweichung und das Durchführen von Chi-Quadrat-Tests. Andere Quellen geben jedoch an, dass dies unangemessen ist und dass Sie eine Hosmer-Lemeshow-Anpassungsgüte durchführen sollten Prüfung. Dann finde ich andere Quellen, aus denen hervorgeht, dass dieser Test möglicherweise stark von den tatsächlichen Gruppierungen und Grenzwerten abhängt (möglicherweise nicht zuverlässig).

Wie sollte man also die logistische Regression diagnostizieren?

ialm
quelle
1
Mögliche Duplikate (oder Sonderfälle) von stats.stackexchange.com/questions/29271/… oder stats.stackexchange.com/questions/44643/… , obwohl keine der beiden Antworten wirklich eine Lösung für Sie bietet .
Peter Ellis
1
Ich empfehle Ihnen, die Monografie von Scott Menard zu lesen, die vor nicht allzu langer Zeit vollständig kostenlos im Internet verfügbar war.
Rolando2
2
Diese Frage zu Anpassungsgütemaßnahmen für die logistische Regression kann hilfreich sein (obwohl Anpassungsgüte natürlich nur einen kleinen Teil der Modelldiagnose ausmacht): stats.stackexchange.com/questions/3559/logistic-regression-which-pseudo-r- Das Quadrat-Maß-ist-die-eins-zu-melden-cox / 3570
Stephan Kolassa

Antworten:

39

Einige neuere Techniken, mit denen ich die Anpassung logistischer Regressionsmodelle beurteilen kann, stammen aus politikwissenschaftlichen Fachzeitschriften:

  • Greenhill, Brian, Michael D. Ward und Audrey Sacks. 2011. Das Trennungsdiagramm: Eine neue visuelle Methode zur Bewertung der Anpassung von Binärmodellen. American Journal of Political Science 55 (4): 991-1002 .
  • Esarey, Justin und Andrew Pierce. 2012. Beurteilung der Anpassungsqualität und Prüfung auf Fehlspezifikation in binärabhängigen Variablenmodellen. Politische Analyse 20 (4): 480-500 . Preprint PDF hier

Diese beiden Techniken sollen die Anpassungstests (wie Hosmer & Lemeshow) ersetzen und potenzielle Fehlspezifikationen (insbesondere Nichtlinearität der in die Gleichung einbezogenen Variablen) identifizieren. Diese sind besonders nützlich, da typische R-Quadrat-Anpassungsmaße häufig kritisiert werden .

Beide oben genannten Arbeiten verwenden vorhergesagte Wahrscheinlichkeiten im Vergleich zu beobachteten Ergebnissen in Parzellen, wodurch die unklare Frage, was in solchen Modellen ein Residuum ist, etwas vermieden wird . Beispiele für Residuen könnten Beiträge zur logarithmischen Wahrscheinlichkeit oder Pearson-Residuen sein (ich glaube, es gibt jedoch noch viel mehr). Eine weitere Kennzahl, die häufig von Interesse ist (obwohl sie kein Residuum ist), ist die DFBeta-Kennzahl (der Betrag, den eine Koeffizientenschätzung ändert, wenn eine Beobachtung aus dem Modell ausgeschlossen wird). Siehe Beispiele in Stata für diese UCLA-Seite zur logistischen Regressionsdiagnose zusammen mit anderen potenziellen Diagnoseverfahren.

Ich habe es nicht zur Hand, aber ich glaube, J. Scott Longs Regressionsmodelle für kategoriale und begrenzte abhängige Variablen gehen auf einfache Weise auf alle diese verschiedenen Diagnosemaßnahmen ausreichend ein.

Andy W
quelle
2
Für die logistische Regression gibt es eine Unmenge anderer Bücher (zumindest in Teilen, wenn nicht vollständig). Agrestis verschiedene Lehrbücher zur kategorialen Datenanalyse, Scott Menard, Hosmer und Lemeshow sowie Frank Harrells RMS-Buch, wurden mir in diesem Forum von verschiedenen Autoren empfohlen.
Andy W
Vielen Dank für Ihre Antwort. Ich denke, es gibt keine einfache Antwort auf meine Frage. Ich werde auf Ihre Empfehlungen eingehen. Prost.
ialm
23

Die Frage war nicht gut genug motiviert. Es muss einen Grund geben, eine Modelldiagnose durchzuführen, z

  • Möglichkeit, das Modell zu ändern, um es zu verbessern
  • Keine Ahnung, welche gerichteten Tests verwendet werden sollen (dh Tests auf Nichtlinearität oder Interaktion)
  • Wenn Sie nicht verstehen, dass eine Änderung des Modells die statistische Inferenz leicht verfälschen kann (Standardfehler, Konfidenzintervalle, Werte)P

Abgesehen von der Überprüfung von Dingen, die orthogonal zur algebraischen Regressionsspezifikation sind (z. B. Untersuchung der Verteilung von Residuen in gewöhnlichen linearen Modellen), kann die Modelldiagnose so viele Probleme verursachen, wie sie meiner Meinung nach lösen. Dies gilt insbesondere für das binäre Logistikmodell, da keine Verteilungsannahme vorliegt.

Daher ist es in der Regel besser, Zeit damit zu verbringen, das Modell zu spezifizieren, insbesondere, keine Linearität für Variablen anzunehmen, die für stark gehalten werden und für die keine vorherigen Beweise auf Linearität hindeuten. In einigen Fällen können Sie ein Modell vorab angeben, das passen muss , z. B. wenn die Anzahl der Prädiktoren gering ist oder Sie zulassen, dass alle Prädiktoren nichtlinear sind und (korrekt) keine Interaktionen annehmen.

Jeder, der der Ansicht ist, dass die Modelldiagnose zum Ändern des Modells verwendet werden kann, sollte diesen Prozess in einer Bootstrap-Schleife ausführen, um die induzierten Modellunsicherheiten korrekt abzuschätzen.

Frank Harrell
quelle
4
Ich bin damit einverstanden, dass sich die Modelldiagnostik aus dem Zweck der Modellierung ergeben sollte. In Ihrem ersten Absatz habe ich jedoch den Eindruck gewonnen, dass Sie der Meinung sind, wir sollten die Modelle, die zu Daten passen, nicht überprüfen. Ich bin mir ziemlich sicher , das ist nicht , was Sie im Sinn hatte. Zusätzlich ist das binäre logistische Modell sicherlich nicht hat Verteilungsannahmen! (Am offensichtlichsten ist, dass nur zwei Werte für die Antwort vorhanden sind)
Wahrscheinlichkeit
3
Abgesehen von der Annahme, dass es nur zwei spezifische mögliche Werte für Y gibt, hat das binäre Logistikmodell keine Dist. Annahmen. Ich persönlich verwende Diagnosediagramme mit logistischer Regression nicht sehr oft und entscheide mich stattdessen dafür, Modelle anzugeben, die flexibel genug sind, um die Daten so anzupassen, wie die Stichprobengröße es uns erlaubt, sie zu untersuchen. In OLS verwende ich als Hauptdiagnoseplot den qq-Plot für die Normalität von Residuen.
Frank Harrell
Aus einer verallgemeinerten linearen Modellperspektive ergibt sich das logistische Modell aus der Binomialverteilung (Bernoulli-Verteilung). Aber selbst dann ist es schwierig, Residuen zu interpretieren.
New_to_this
Es ist nicht hilfreich, über Verteilungen zu sprechen, bei denen die Zufallsvariable nur zwei Werte annehmen kann (dh Bernoulli-Verteilung), da die Verteilungsannahme auf keinen Fall falsch sein kann, es sei denn, die Beobachtungen sind nicht unabhängig.
Frank Harrell
1
@FrankHarrell Mir ist klar, dass Sie wissen, wovon Sie hier sprechen, aber ich glaube nicht, dass es der gesamten Community durch Ihre Posts / Kommentare klar wird, dass der lineare Prädiktor (oder sogar der additive Prädiktor in a falsch angegeben wurde GAM-Framework) kann zu Problemen bei der logistischen Regression führen. Viele werden es vielleicht nicht zu schätzen wissen, dass die Daten dadurch nicht unabhängig werden, wie Sie sagen. Wenn die Schüler zum ersten Mal auf eine lineare Regression stoßen, lernen sie, die Residuen zu untersuchen, ohne zwischen einer falschen Spezifikation des linearen Prädiktors und einer falschen Spezifikation der Fehlerverteilung zu unterscheiden.
Jacob Socolar
5

Dieser Thread ist ziemlich alt, aber ich dachte, es wäre nützlich, hinzuzufügen, dass Sie seit kurzem das DHARMa R-Paket verwenden können, um die Residuen eines beliebigen GL (M) M in einen standardisierten Raum umzuwandeln. Sobald dies erledigt ist, können Sie verbleibende Probleme wie Abweichungen von der Verteilung, verbleibende Abhängigkeit von einem Prädiktor, Heteroskedastizität oder Autokorrelation auf normale Weise visuell bewerten / testen. In der Paketvignette finden Sie ausgearbeitete Beispiele sowie weitere Fragen zum Lebenslauf hier und hier .

Florian Hartig
quelle