Problem beim Vergleichen von GLM-Modellen mit einer anderen Verknüpfungsfunktion

12

Wie kann ich Modelle mit unterschiedlichen Verknüpfungsfunktionen vergleichen, wenn dieselben Kovariaten und Verteilungsfamilien verwendet werden?

Ich denke, die richtige Antwort hier ist "AIC / BIC", aber ich bin nicht 100% sicher.

Ist es möglich, verschachtelte Modelle zu haben, wenn sie einen anderen Link haben?

Davide
quelle
Es ist zu beachten, dass "AIC / BIC" eine der möglichen Antworten ist, aber im Prinzip jede (geeignete) Modellauswahlmethode verwendet werden kann.
2
Nein, sie sind nicht verschachtelt. Denken Sie auch daran, dass bei Verwendung von AIC / BIC auch die Normalisierungskonstanten von Bedeutung sind .
5
Informationskriterien wie AIC und BIC passen einfach die Abweichung des Modells von seiner Komplexität an (dh die Anzahl der Parameter). Wenn Sie die gleiche Anzahl von Kovariaten haben (nicht unbedingt die gleiche Anzahl von Kovariaten selbst), ist diese Anpassung irrelevant. Sie können sie überprüfen, indem Sie die Abweichungen direkt vergleichen. Vielleicht finden Sie es hilfreich, meine Antwort hier zu lesen: Unterschied zwischen logit- und probit-Modellen , die dieses Problem ansprechen .
gung - Reinstate Monica
3
Eine andere Möglichkeit zum Vergleichen von Modellen, die sehr allgemein ist, jedoch mehr von Ihnen erfordert, ist die Verwendung der parametrischen Bootstrap-Cross-Fitting-Methode. Sie können eine PDF finden Sie hier .
gung - Wiedereinsetzung von Monica
2
Gibt es eine bestimmte Familie, die Sie mit 2 möglichen Verbindungsfunktionen im Sinn haben? dh Binomialfamilie, logit vs log link?
Placidia

Antworten:

9

Für dieses Problem können Sie auch so genannte „Güte von Link - Tests“ verwenden, die kanonische Behandlung durch Daryl Pregibon in Applied Statistics 1980 veröffentlicht wurden Sie könnten das lesen wollen Papier hier.

In jüngerer Zeit wurde auch an dieser Front gearbeitet, insbesondere von Cheng und Wu in ihrem 1994 erschienenen JASA-Papier .

Wie von @gung angegeben, ist die Verwendung der Abweichung auch möglich, siehe z. B. dieses Papier, wenn Sie es nicht zum Nennwert annehmen möchten.

Momo
quelle
3
+1, es ist schön, das kanonische Papier zu haben. Übrigens, ich vermute, Sie meinten die jüngste Arbeit, nicht die "Vernunft".
gung - Wiedereinsetzung von Monica
6

(Ich kopiere nur die Informationen aus den Kommentaren hierher, damit diese Frage nicht als offiziell unbeantwortet angezeigt wird.)

Sie können die beiden Modelle vergleichen, indem Sie die Abweichungen vergleichen. Der AIC und der BIC passen lediglich die Abweichungen für die Anzahl der Parameter im Modell an. Da diese Zahl dieselbe ist, macht es keinen Unterschied. Im Allgemeinen wird es sehr schwierig sein, zwischen verschiedenen Verbindungsfunktionen zu unterscheiden, es sei denn, sie unterscheiden sich in ihrer Form. es ist oft besser, theoretisches Wissen zu verwenden, um die entsprechende Verknüpfungsfunktion zu bestimmen. Zum Beispiel unterscheiden sich die Verknüpfungen logit und probit kaum in der Form, unterscheiden sich jedoch in der Art und Weise, wie Sie über den Prozess der Datengenerierung nachdenken (wie ich hier diskutiere ).

gung - Wiedereinsetzung von Monica
quelle