Maß der erklärten Varianz für Poisson GLM (Log-Link-Funktion)

8

Ich suche ein geeignetes Maß für die "erklärte Varianz" eines Poisson GLM (unter Verwendung einer Log-Link-Funktion).

Ich habe eine Reihe verschiedener Ressourcen gefunden (sowohl auf dieser Site als auch anderswo), die eine Reihe verschiedener Pseudo- -Maßnahmen diskutieren , aber fast jede Site erwähnt die Maßnahmen in Bezug auf eine Logit-Link-Funktion und sie diskutieren nicht ob die Pseudo- R 2 -Messungen für andere Verknüpfungsfunktionen geeignet sind, wie z. B. log-link für meine Poission-Verteilung GLM.R2R2

Hier sind zum Beispiel einige der Websites, die ich gefunden habe:

Welches Pseudo- -Maß ist für die logistische Regression zu melden (Cox & Snell oder Nagelkerke)?R2

http://thestatsgeek.com/2014/02/08/r-squared-in-logistic-regression/

http://www.ats.ucla.edu/stat/mult_pkg/faq/general/Psuedo_RSquareds.htm

Meine Frage ist: Sind eine der unter diesen Links diskutierten Methoden (insbesondere die FAQ auf der UCLA-Seite) für einen Poission GLM (unter Verwendung einer Log-Link-Funktion) geeignet? Ist eine bestimmte Methode geeigneter und / oder standardmäßiger als jede andere Methode?

Einige Hintergrundinformationen:

Dies ist für eine Forschungsarbeit, in der ich ein Poission GLM verwende, um neuronale Daten zu analysieren. Ich verwende die Abweichungen der Modelle (berechnet unter Annahme einer Poissionsverteilung), um zwei Modelle zu vergleichen: Ein Modell (A), das 5 Parameter enthält, die vom anderen Modell (B) weggelassen wurden. Mein Interesse (und der Schwerpunkt der Arbeit) ist es zu zeigen, dass 5 Parameter die Modellanpassung statistisch verbessern. Einer der Gutachter möchte jedoch angeben, wie gut beide Modelle zu den Daten passen.

Wenn ich OLS verwendet habe, um meine Daten anzupassen, fragt der Prüfer effektiv nach dem -Wert sowohl für das Modell mit den 5 Parametern als auch ohne die 5 Parameter, um anzugeben, wie gut jedes Modell die Varianz erklärt. Es scheint mir eine vernünftige Bitte zu sein. Nehmen wir an, dass Modell B hypothetisch einen R 2 von 0,05 und Modell A einen R 2 von 0,25 hat: Auch wenn dies eine statistisch signifikante Verbesserung darstellt, kann keines der beiden Modelle die Daten gut erklären. Alternativ, wenn Modell B ein R 2 von 0,5 und Modell A ein R 2 hatR2R2R2R2R2von 0,7, das könnte auf eine ganz andere Weise interpretiert werden. Ich suche nach der am besten geeigneten Maßnahme, die auf ähnliche Weise wie mein GLM angewendet werden kann.

Benjamin Kraus
quelle
Warum würde ein BIC nicht funktionieren oder den Unterschied in den Log-Wahrscheinlichkeiten testen, zumal eine eine verschachtelte Version der anderen ist?
Mike Hunter
Dies ist für meine Zwecke etwas spät (das Papier wurde am vergangenen Mittwoch online veröffentlicht), aber für die Aufzeichnung: Ich verwende den Unterschied in den Log-Wahrscheinlichkeiten als primäres Maß, aber ein Prüfer wollte ein Maß für die "erklärte Varianz". Um die Rezensenten zu beruhigen, habe ich versucht, mir etwas auszudenken. Am Ende hatte ich so etwas wie das, was Nukimov unten vorschlug.
Benjamin Kraus

Antworten:

1

McCullagh und Nelder 1989 (Seite 34) geben für die Abweichungsfunktion für die Poisson-Verteilung an:D

D=2(ylog(yμ)+(yμ))

μED

ED=1Dtotal deviance

Dymean(y)μ

μ=y

Nukimov
quelle
1
pseudoRM2=ln(ΓM)ln(ΓNull)ln(ΓSat)ln(ΓNull)
ln(ΓSat)ln(ΓNull)ln(ΓM)