Bruchabhängige Variable: Warum nicht die Poisson-Regression verwenden?

7

In vielen Situationen sind wir daran interessiert, ein Modell mit einer fraktionalen abhängigen Variablen zu schätzen. Zum Beispiel berücksichtigt Papke & Wooldridge (1996) http://faculty.smu.edu/millimet/classes/eco6375/papers/papke%20wooldridge%201996.pdf die Teilnahmequoten für 401 (k) , wobei die Rate als definiert . Die Autoren entwickeln dann eine GLM-Methode, um solche Modelle abzuschätzen. Wenn ich mir die Literatur zu Zähldaten anschaue, frage ich mich, ob man keine Poisson-Regression von für dieselbe Gruppe von Regressoren und als Offset- . Hängt dies möglicherweise von der absoluten Anzahl der ?PRATE=accountsemplyeesaccountsemployeesaccounts

Dies unterscheidet sich von einem vorgeschlagenen Duplikat. Welches Regressionsmodell eignet sich am besten für Zähldaten? da meine Frage die richtige Stelle des Offsets / Nenners bespricht.

Felix H.
quelle
... als Offset-Log (Mitarbeiter) ;-) (falls Log-Link verwendet)! imho ... du hast die gleichen Ergebnisse, aber was (in welchem ​​Maßstab ...) wirst du nicht (bevorzugen) interpretieren? - Nur eine Frage des Geschmacks ...
Ivan Kshnyasev
1
Mögliches Duplikat von Welches Regressionsmodell eignet sich am besten für Zähldaten?
kjetil b halvorsen
Das glaube ich nicht. Ich frage nach Zähldaten mit einer sehr eindeutigen Offest- / Expositionsvariablen und wann etwas als Rate oder Zählung modelliert werden soll.
Felix H
Sie müssen log (Mitarbeiter) als Offset verwenden. Können Sie weitere Einzelheiten zu Ihrer Bewerbung angeben? Eine sehr ausführliche Beschreibung des Wie / Warum des Versatzes finden Sie in stats.stackexchange.com/questions/142338/… . Sie können sich auch stats.stackexchange.com/questions/307369/… ansehen. (Beide sind besser dupliziert als die vorgeschlagene oben)
kjetil b halvorsen

Antworten:

1

Ein Grund, die Poisson-Regression hier nicht zu verwenden, besteht darin, dass die Anzahl der Konten durch die Anzahl der Mitarbeiter begrenzt ist, da jeder Mitarbeiter höchstens ein Konto haben kann. Eine Poisson-Verteilung würde eine Wahrscheinlichkeit ungleich Null für die Anzahl der Konten zulassen, die die Anzahl der Mitarbeiter überschreitet. Mein Verständnis ist, dass, obwohl Poisson-Regressionen gegenüber vielen Verstößen gegen Annahmen robust sind, Sie zumindest einen Effizienzverlust durch die Verwendung einer Poisson-Regression im Vergleich zu etwas angemessenerem erhalten würden.

Die Frage sollte dann lauten: Wäre eine binomiale Regression nicht angemessener? (Unter der Annahme der gleichen Teilnahmequote für jeden Mitarbeiter sollte die Anzahl der Pläne als wobei die Anzahl der Mitarbeiter ist.) IIRC, der Grund, warum eine Binomialregression in diesem Fall nicht angewendet werden kann ist, dass die Anzahl der Mitarbeiter nicht bekannt ist; nur die Teilnahmequote selbst ist bekannt. Das schließt eine binomiale Regression aus - und würde auch eine Poisson-Regression mit einem Offset ausschließen, selbst wenn dies angemessen wäre.pyBinomial(n,p)n

Der Lakoniker
quelle
Vielen Dank für Ihre Antwort! Was wäre, wenn wir wüssten, wie viele Mitarbeiter und jeder Mitarbeiter nur null oder ein Konto haben könnte?
Felix H
Das ist der binomiale Regressionsfall.
The Laconic
Sicher, aber was sollte dann vorzuziehen sein? Binomial oder mit etwas Offset zählen?
Felix H
Binomial. Ein Offset bewirkt nichts, dass die Verteilung oben begrenzt bleibt. Die Anzahl der Beobachtungen kann im Prinzip nicht aus einer Poisson-Verteilung stammen. Wenn andererseits jeder Mitarbeiter null oder ein Konto haben kann und die Wahrscheinlichkeit , ein Konto zu haben, für jeden Mitarbeiter in einer Gruppe von Mitarbeitern gleich ist, wird die Gesamtzahl der Konten buchstäblich als Binomial (n, p) verteilt ). pn
The Laconic