Ich weiß, dass standardisierte Pearson-Residuen auf traditionelle probabilistische Weise erhalten werden:
und Abweichungsreste werden auf statistischere Weise erhalten (der Beitrag jedes Punktes zur Wahrscheinlichkeit):
Dabei ist = 1, wenn = 1 und = -1, wenn = 0.y i s i y i
Können Sie mir intuitiv erklären, wie die Formel für Abweichungsreste zu interpretieren ist?
Außerdem, wenn ich eine auswählen möchte, welche ist besser geeignet und warum?
Übrigens behaupten einige Referenzen, dass wir die Abweichungsreste basierend auf dem Begriff ableiten
wo ist oben erwähnt.
Antworten:
Die logistische Regression versucht, die Log-Likelihood-Funktion zu maximieren
wobei die vorhergesagte Wahrscheinlichkeit ist, dass der Fall i ; ist die Anzahl der Fälle, die als und ist die Anzahl der (übrigen) Fälle, die als .Pi Y^=1 k Y=1 r Y=0
Dieser Ausdruck ist gleich
weil der Abweichungsrest eines Falls wie folgt definiert ist:
Die binäre logistische Regression versucht daher direkt, die Summe der quadratischen Abweichungsreste zu minimieren. Es sind die Abweichungsreste, die im ML-Algorithmus der Regression impliziert sind.
Die Chi-Quadrat-Statistik der Modellanpassung ist , wobei das Prädiktoren enthält und das reduzierte Modell keine enthält.2(LLfull model−LLreduced model)
quelle