Verwenden Sie die Poisson-Regression für kontinuierliche Daten?

11

Kann die Poisson-Verteilung verwendet werden, um sowohl kontinuierliche als auch diskrete Daten zu analysieren?

Ich habe einige Datensätze, in denen Antwortvariablen kontinuierlich sind, aber eher einer Poisson-Verteilung als einer Normalverteilung ähneln. Die Poisson-Verteilung ist jedoch eine diskrete Verteilung und befasst sich normalerweise mit Zahlen oder Zählungen.

user3136
quelle
Wie unterscheiden sich Ihre empirischen Verteilungen dann von Gamma-Variablen?
whuber
1
Ich habe die Gammaverteilung für diese Daten verwendet. Wenn Sie die Gammaverteilung mit einem Protokolllink verwenden, erhalten Sie fast genau das gleiche Ergebnis wie bei einem überdispersen Poisson-Modell. In den meisten statistischen Paketen ist die Poisson-Regression jedoch einfacher und viel flexibler.
user3136
Würde es nicht andere Distributionen geben, die besser sind, zB Whubers Vorschlag von Gamma?
Peter Flom - Monica wieder einsetzen
1
@PeterFlom - Ich frage mich, ob dieses Problem häufig auftritt, da das glmnet-Paket in R weder die Gamma-Familie noch die Gauß-Familie mit einer Protokollverknüpfungsfunktion unterstützt. Da glmnet jedoch als prädiktives Modellierungspaket verwendet wird (daher interessieren sich Benutzer nur für Modellkoeffizienten, nicht für Koeffizientenfehler), und weil das Poisson dbn konsistente Koeffizienten erzeugt. Schätzungen für Modelle der Form ln [E (y)] = beta0 + beta * X mit kontinuierlichen Antworten unabhängig von der Verteilung, ich vermute, die Autoren von glmnet haben sich nicht die Mühe gemacht, diese zusätzlichen Familien einzubeziehen.
RobertF

Antworten:

12

Die Schlüsselannahme eines verallgemeinerten linearen Modells, das hier relevant ist, ist die Beziehung zwischen der Varianz und dem Mittelwert der Antwort angesichts der Werte der Prädiktoren. Wenn Sie eine Poisson-Verteilung angeben, bedeutet dies, dass Sie davon ausgehen, dass die bedingte Varianz gleich dem bedingten Mittelwert ist. * Die tatsächliche Form der Verteilung spielt keine so große Rolle: Es kann sich um Poisson, Gamma oder Normal handeln. oder irgendetwas anderes, solange diese Mittelwert-Varianz-Beziehung gilt.

* Sie können die Annahme lockern, dass die Varianz dem Mittelwert der Proportionalität entspricht und normalerweise immer noch gute Ergebnisse erzielt.

Hong Ooi
quelle
9

Wenn Sie über die Verwendung einer Poisson-Antwort in einem verallgemeinerten linearen Modell sprechen, dann ja, wenn Sie bereit sind, die Annahme zu treffen, dass die Varianz jeder Beobachtung gleich ihrem Mittelwert ist.

Wenn Sie dies nicht möchten, besteht eine andere Alternative darin, die Antwort zu transformieren (z. B. Protokolle zu erstellen).

Simon Byrne
quelle
Ich denke, zusätzlich zu Ihrem Punkt kann er / sie die quasipoissonFamilie in verwenden , auch wenn @ user3136 nicht bereit ist, die Annahme von Mittelwert = Varianz zu treffen glm.
Suncoolsu
2
Mein Problem ist jedoch, warum Sie fortlaufende Daten in diskrete Daten umwandeln möchten. Es geht im Wesentlichen um Informationen. Auch wenn eine einfache logTransformation funktioniert hätte, warum sollten Sie Ihre Daten diskretisieren? Verwenden von glmWerken, aber jedes Ergebnis basiert auf Asymptotik (die möglicherweise gilt oder nicht)
suncoolsu
@suncoolsu: 1) Quasipoisson macht die Annahme des Mittelwerts proportional zur Varianz. 2) Ich meinte nicht Transformation in diskret, sondern Transformation (Aufrechterhaltung der Kontinuität), damit Sie ein anderes Modell verwenden können.
Simon Byrne
Ja - ich habe verstanden, dass ich Ihnen zustimme. Entschuldigung, ich habe über die Frage gesprochen. Quasi-Poisson, berücksichtigt Überdisperson, oder? (Wenn ich mich richtig erinnere, vgl. Faraway 2006)
Suncoolsu
In diesem speziellen Fall war ich nicht zufrieden, dass eine von mir versuchte Transformation (log, sqrt, box-cox) eine gute Annäherung an die Normalität ergab. Übrigens, wenn ich die normale Score-Transformation verwende, kann ich die meisten Daten in eine fast schöne Normalität umwandeln, aber ich habe diese Transformation nicht weit verbreitet gesehen, daher gehe ich davon aus, dass es einen Haken gibt (es ist schwierig, sie zurück zu transformieren).
user3136