Aufgrund der Fakultät in einer Poisson-Verteilung wird es unpraktisch, Poisson-Modelle (beispielsweise unter Verwendung der maximalen Wahrscheinlichkeit) zu schätzen, wenn die Beobachtungen groß sind. Wenn ich zum Beispiel versuche, ein Modell zu schätzen, um die Anzahl der Selbstmorde in einem bestimmten Jahr zu erklären (es sind nur jährliche Daten verfügbar) und zu sagen, dass es jedes Jahr Tausende von Selbstmorden gibt, ist es falsch, Selbstmorde in Hunderten auszudrücken , so dass 2998 29,98 ~ = 30 wäre? Mit anderen Worten, ist es falsch, die Maßeinheit zu ändern, um die Daten verwaltbar zu machen?
n!
=Gamma(n+1)
für n> = 0. Suchen Sie also nach einer Funktion, die aufgerufen wird,Gamma
wenn Sie die Fakultät berechnen müssen (oder log Gamma, wenn Sie die log-Wahrscheinlichkeit berechnen)Das kannst du leider nicht. Wie @Baltimark feststellt, hat die Verteilung mit großem Lambda eine normalere Form (symmetrisch), und wenn sie verkleinert wird, ist sie keine Giftverteilung mehr. Versuchen Sie den folgenden Code in R:
Das Ergebnis ist unten:
Sie können sehen, dass sich die verkleinerte Poisson (rote Linie) von der Poisson-Verteilung vollständig unterscheidet.
quelle
Sie können den Faktor einfach ignorieren, wenn Sie die maximale Wahrscheinlichkeit verwenden. Hier ist die Begründung für Ihr Beispiel für Selbstmorde. Lassen:
λ: Geben Sie die erwartete Anzahl an Selbstmorden pro Jahr an
k i : Geben Sie die Anzahl der Selbstmorde im Jahr i an.
Dann würden Sie die Log-Wahrscheinlichkeit wie folgt maximieren:
LL = ∑ (k i log (λ) - λ - k i !)
Das Maximieren des Obigen entspricht dem Maximieren des Folgenden als k i ! ist eine Konstante:
LL ' = ∑ (k i log (λ) - λ)
Könnte erklären, warum die Fakultät ein Problem ist? Vermisse ich etwas?
quelle