Eine Poisson-Regression ist ein GLM mit einer Log-Link-Funktion.
Eine alternative Möglichkeit, nicht normalverteilte Zählerdaten zu modellieren, besteht in der Vorverarbeitung, indem das Protokoll (bzw. das Protokoll (1 + Zähler) zur Behandlung von Nullen) verwendet wird. Wenn Sie eine Regression der kleinsten Quadrate für die Anzahl der logarithmischen Antworten durchführen, hängt dies mit einer Poisson-Regression zusammen? Kann es mit ähnlichen Phänomenen umgehen?
regression
poisson-distribution
generalized-linear-model
Brendan OConnor
quelle
quelle
Antworten:
Einerseits ist in einer Poisson-Regression die linke Seite der Modellgleichung der Logarithmus der erwarteten Anzahl: .Log( E[ Y| x])
Andererseits ist in einem linearen "Standard" -Modell die linke Seite der erwartete Wert der normalen Antwortvariablen: . Insbesondere ist die Verknüpfungsfunktion die Identitätsfunktion.E[ Y| x]
Nehmen wir nun an, ist eine Poisson-Variable und Sie möchten sie normalisieren, indem Sie das Protokoll verwenden: Y ′ = log ( Y ) . Da Y ' normal sein soll, planen Sie, das lineare Standardmodell anzupassen, für das die linke Seite E [ Y ' | ist x ] = E [ log ( Y ) | x ] . Im Allgemeinen ist E [ log ( Y ) | x ] ≠ log ( EY. Y.′= log( Y) Y.′ E[ Y′| x]=E[ log( Y) | x ] . Infolgedessen sind diese beiden Modellierungsansätze unterschiedlich.E[ log( Y) | x ] ≠ log( E[ Y| x])
quelle
Ich sehe zwei wichtige Unterschiede.
Erstens verhalten sich die vorhergesagten Werte (auf der ursprünglichen Skala) unterschiedlich; in loglinearen kleinsten Quadraten stellen sie bedingte geometrische Mittel dar; im log-poisson-Modell stellen sie bedingte Mittel dar. Da die Daten in dieser Art der Analyse häufig falsch sind, wird der bedingte geometrische Mittelwert den bedingten Mittelwert unterschätzen.
Ein zweiter Unterschied ist die implizite Verteilung: lognormal versus poisson. Dies bezieht sich auf die Heteroskedastizitätsstruktur der Residuen: Residuenvarianz proportional zu den quadrierten erwarteten Werten (lognormal) gegenüber Residuenvarianz proportional zum erwarteten Wert (Poisson).
quelle
Ein offensichtlicher Unterschied besteht darin, dass die Poisson-Regression Ganzzahlen als Punktvorhersagen liefert, wohingegen die lineare logarithmische Regression Nicht-Ganzzahlen liefern kann.
quelle