Testen Sie das GLM-Modell mit Null und Modellabweichungen

11

Ich habe ein glm-Modell in R erstellt und es mithilfe einer Test- und Trainingsgruppe getestet. Ich bin daher zuversichtlich, dass es gut funktioniert. Die Ergebnisse von R sind:

Coefficients:
                            Estimate Std. Error  t value Pr(>|t|)    
(Intercept)               -2.781e+00  1.677e-02 -165.789  < 2e-16 ***
Coeff_A                    1.663e-05  5.438e-06    3.059  0.00222 ** 
log(Coeff_B)               8.925e-01  1.023e-02   87.245  < 2e-16 ***
log(Coeff_C)              -3.978e-01  7.695e-03  -51.689  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for quasibinomial family taken to be 0.9995149)

    Null deviance: 256600  on 671266  degrees of freedom
Residual deviance: 237230  on 671263  degrees of freedom
AIC: NA

Alle p-Werte für die Koeffizienten sind erwartungsgemäß klein.

Wenn ich mir diese Frage ansehe ( Interpretation der Rest- und Nullabweichung in GLM R ), sollte ich in der Lage sein zu berechnen, ob die Nullhypothese unter Verwendung der folgenden Gleichung gilt:

p-value = 1 - pchisq(deviance, degrees of freedom)

Wenn Sie dies einfügen, erhalten Sie:

1 - pchisq(256600, 671266)
[1] 1

Habe ich also Recht, wenn ich denke, dass die Nullhypothese hier nicht verworfen werden kann, obwohl die p-Werte für alle Koeffizienten so klein sind, oder habe ich falsch interpretiert, wie dies zu berechnen ist?

Zfunk
quelle

Antworten:

17

Hier gibt es ein Missverständnis. Die Differenz zwischen der Nullabweichung und der Abweichung des Modells wird als Chi-Quadrat mit Freiheitsgraden verteilt, die gleich der Null-df minus der df des Modells sind. Für Ihr Modell wäre das:

1-pchisq(256600 - 237230, df=(671266 - 671263))
# [1] 0

pchisq()lower.tail = FALSE1

gung - Monica wieder einsetzen
quelle
1
Welche Hypothese testen Sie genau mit der Aussage 1-pchisq(256600 - 237230, df=(671266 - 671263))?
II
4
@jesterII, Sie überprüfen, ob sich die Abweichung stärker geändert hat, als dies zufällig zu erwarten wäre. Das heißt, Sie testen, ob das Modell insgesamt besser ist als das Nullmodell. Es ist analog zum globalen F-Test in einem linearen Modell.
Gung - Reinstate Monica
Die Nullhypothese lautet "Das Modell als Ganzes ist besser als das Nullmodell", und Sie haben die Nullhypothese abgelehnt, was bedeutet, dass das Modell schlecht ist?
II
3
@jesterII, nein, die Nullhypothese lautet: 'Das Modell als Ganzes ist nicht besser als das Nullmodell'. Da dies abgelehnt wurde, schließen wir, dass die Daten nicht mit dem Nullmodell übereinstimmen. Hinweis: Dies bedeutet nicht unbedingt, dass unser Modell "gut" oder "korrekt" ist.
Gung - Reinstate Monica