Ich habe das folgende Ergebnis aus der Ausführung der glm-Funktion.
Wie kann ich die folgenden Werte interpretieren:
- Nullabweichung
- Restabweichung
- AIC
Haben sie etwas mit der guten Passform zu tun? Kann ich aus diesen Ergebnissen ein Maß für die Anpassungsgüte berechnen, z. B. R-Quadrat oder ein anderes Maß?
Call:
glm(formula = tmpData$Y ~ tmpData$X1 + tmpData$X2 + tmpData$X3 +
as.numeric(tmpData$X4) + tmpData$X5 + tmpData$X6 + tmpData$X7)
Deviance Residuals:
Min 1Q Median 3Q Max
-0.52628 -0.24781 -0.02916 0.25581 0.48509
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept -1.305e-01 1.391e-01 -0.938 0.3482
tmpData$X1 -9.999e-01 1.059e-03 -944.580 <2e-16 ***
tmpData$X2 -1.001e+00 1.104e-03 -906.787 <2e-16 ***
tmpData$X3 -5.500e-03 3.220e-03 -1.708 0.0877 .
tmpData$X4 -1.825e-05 2.716e-05 -0.672 0.5017
tmpData$X5 1.000e+00 5.904e-03 169.423 <2e-16 ***
tmpData$X6 1.002e+00 1.452e-03 690.211 <2e-16 ***
tmpData$X7 6.128e-04 3.035e-04 2.019 0.0436 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for gaussian family taken to be 0.08496843)
Null deviance: 109217.71 on 3006 degrees of freedom
Residual deviance: 254.82 on 2999 degrees of freedom
(4970 observations deleted due to missingness)
AIC: 1129.8
Number of Fisher Scoring iterations: 2
Antworten:
glm
glm
Es wird diskutiert, wie ein solches Maß auf der LHS interpretiert wird, aber nur, wenn die Modelle von der einfacheren Gaußschen / OLS-Situation abweichen. In GLMs, in denen die Verknüpfungsfunktion möglicherweise nicht wie hier "Identität" ist und der "quadratische Fehler" möglicherweise nicht dieselbe klare Interpretation aufweist, wird das Akaike-Informationskriterium ebenfalls gemeldet, da es allgemeiner zu sein scheint. Es gibt mehrere andere Konkurrenten im GLM GOF-Gewinnspiel ohne klaren Sieger.
quelle
Verwenden Sie die Nullabweichung und die Restabweichung, insbesondere:
Wenn Sie darüber nachdenken, versuchen Sie, das Verhältnis der Abweichung in Ihrem Modell zur Null zu messen. Wie viel besser ist Ihr Modell (Restabweichung) als nur der Achsenabschnitt (Nullabweichung)? Wenn dieses Verhältnis winzig ist, "erklären" Sie den größten Teil der Abweichung in der Null; 1 minus das bringt dir dein R-Quadrat.
In Ihrer Instanz würden Sie .998 erhalten.
Wenn Sie nur das lineare Modell (lm) anstelle von glm aufrufen, erhalten Sie in der Zusammenfassung explizit ein R-Quadrat, und Sie können sehen, dass es dieselbe Zahl ist.
quelle
Wenn Sie ein binäres Logistikmodell ausführen, können Sie auch den Hosmer Lemeshow Goodness of Fit-Test für Ihr glm () -Modell ausführen. Verwenden der ResourceSelection-Bibliothek.
quelle
family = "binomial
. Das Beispiel für OP ist die lineare Regression.hoslem.test()