Ich möchte eine logistische Regression mit der folgenden Binomialantwort und mit und als meinen Prädiktoren durchführen.
Ich kann die gleichen Daten wie Bernoulli-Antworten im folgenden Format präsentieren.
Die logistischen Regressionsausgaben für diese beiden Datensätze sind größtenteils gleich. Die Abweichungsreste und der AIC sind unterschiedlich. (Der Unterschied zwischen der Nullabweichung und der Restabweichung ist in beiden Fällen gleich - 0,228.)
Das Folgende sind die Regressionsausgaben von R. Die Datensätze heißen binom.data und bern.data.
Hier ist die Binomialausgabe.
Call:
glm(formula = cbind(Successes, Trials - Successes) ~ X1 + X2,
family = binomial, data = binom.data)
Deviance Residuals:
[1] 0 0 0
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.9649 21.6072 -0.137 0.891
X1Yes -0.1897 2.5290 -0.075 0.940
X2 0.3596 1.9094 0.188 0.851
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 2.2846e-01 on 2 degrees of freedom
Residual deviance: -4.9328e-32 on 0 degrees of freedom
AIC: 11.473
Number of Fisher Scoring iterations: 4
Hier ist die Bernoulli-Ausgabe.
Call:
glm(formula = Success ~ X1 + X2, family = binomial, data = bern.data)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.6651 -1.3537 0.7585 0.9281 1.0108
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.9649 21.6072 -0.137 0.891
X1Yes -0.1897 2.5290 -0.075 0.940
X2 0.3596 1.9094 0.188 0.851
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 15.276 on 11 degrees of freedom
Residual deviance: 15.048 on 9 degrees of freedom
AIC: 21.048
Number of Fisher Scoring iterations: 4
Meine Fragen:
1) Ich kann sehen, dass die Punktschätzungen und Standardfehler zwischen den beiden Ansätzen in diesem speziellen Fall äquivalent sind. Trifft diese Äquivalenz im Allgemeinen zu?
2) Wie kann die Antwort auf Frage 1 mathematisch begründet werden?
3) Warum unterscheiden sich die Abweichungsreste und der AIC?
Ich möchte nur einen Kommentar zum letzten Absatz abgeben: „Die Tatsache, dass der AIC unterschiedlich ist (aber die Änderung der Abweichung nicht), kehrt zu dem konstanten Ausdruck zurück, der der Unterschied zwischen den logarithmischen Wahrscheinlichkeiten der beiden Modelle war. Bei der Berechnung der Abweichungsänderung wird diese ausgeglichen, da sie bei allen Modellen auf der Grundlage der gleichen Daten gleich ist. "Leider ist dies für die Abweichungsänderung nicht korrekt. Die Abweichung enthält nicht den konstanten Term Ex (zusätzliche Konstante Term in der Log-Wahrscheinlichkeit für die Binomialdaten). Die Änderung der Abweichung hat daher nichts mit dem konstanten Term EX zu tun. Die Abweichung vergleicht ein gegebenes Modell mit dem vollständigen Modell. Die Abweichungen unterscheiden sich von Bernoulli / binär und die binomiale Modellierung, aber die Änderung der Abweichung ist nicht auf den Unterschied der Log-Likelihood-Werte des vollständigen Modells zurückzuführen. Diese Werte werden bei der Berechnung der Abweichungsänderungen aufgehoben. Daher ergeben Bernoulli- und binomiale logistische Regressionsmodelle identische Abweichungsänderungen, sofern die vorhergesagten Wahrscheinlichkeiten pij und pi gleich sind. Dies gilt in der Tat für die Probit- und andere Link-Funktionen.
Es sei lBm und lBf die Log-Likelihood-Werte von der Anpassung von Modell m und Vollmodell f an Bernoulli-Daten. Die Abweichung ist dann
Obwohl das lBf für die Binärdaten Null ist, haben wir den DB nicht vereinfacht und beibehalten. Die Abweichung von der binomialen Modellierung mit den gleichen Kovariaten ist
Dabei sind lbf + Ex und lbm + Ex die Log-Likelihood-Werte der an die Binomialdaten angepassten Modelle full und m. Der extra konstante Term (Ex) verschwindet von der rechten Seite des Db. Betrachten Sie nun die Abweichungsänderung von Modell 1 zu Modell 2. Bei der Bernoulli-Modellierung haben wir die Abweichungsänderung von
Ebenso ist die Änderung der Abweichung von der Binomialanpassung
Daraus folgt sofort, dass die Abweichungsänderungen frei von den Log-Likelihood-Beiträgen der Vollmodelle IBF und IBF sind. Daher erhalten wir die gleiche Abweichungsänderung, DBC = DbC, wenn lBm1 = lbm1 und lBm2 = lbm2. Wir wissen, dass dies hier der Fall ist und dass wir die gleichen Abweichungsänderungen von der Bernoulli- und Binomialmodellierung erhalten. Der Unterschied zwischen lbf und lBf führt zu den unterschiedlichen Abweichungen.
quelle