Wie berechnet man ein Konfidenzniveau für eine Poisson-Verteilung?

32

Ich würde gerne wissen, wie sicher ich in meinem . Kennt jemand eine Möglichkeit, ein höheres und ein niedrigeres Vertrauensniveau für eine Poisson-Verteilung festzulegen?λ

  • Beobachtungen ( ) = 88n
  • Probenmittelwert ( ) = 47,18182λ

Wie würde das 95% -Vertrauen dafür aussehen?

Travis
quelle
Sie könnten auch in Betracht ziehen, Ihre Schätzungen zu booten. Hier ist ein kurzes Tutorial zum Bootstrapping.
Mark T Patterson

Antworten:

27

Für Poisson sind sowohl der Mittelwert als auch die Varianz . Wenn Sie das Konfidenzintervall um Lambda wollen, können Sie den Standardfehler als berechnen .λλ/n

Das 95-prozentige Konfidenzintervall ist .λ^±1.96λ^/n

Nick Stauner
quelle
26
Dies ist in Ordnung , wenn groß ist, denn dann wird die Poisson durch eine Normalverteilung hinreichend angenähert. Für kleinere Werte oder ein höheres Vertrauen stehen bessere Intervalle zur Verfügung. Siehe math.mcmaster.ca/peter/s743/poissonalpha.html für zwei von ihnen zusammen mit einer Analyse ihrer tatsächlichen Abdeckung. (Hier ist das "genaue" Intervall (45,7575, 48,6392), das "Pearson" Intervall (45,7683, 48,639) und die normale Näherung ergibt (45,7467, 48,617): es ist ein wenig zu niedrig, aber nahe genug, weil n λ = 4152 ).nλnλ=4152
whuber
4
Für andere verwirrt wie ich: Hier ist eine Beschreibung, wo die 1,96 herkommt.
Mjibson
2
Wie haben Sie das genaue Intervall für dieses Problem anhand der von whuber auf dieser Website angegebenen Informationen berechnet? Ich konnte nicht folgen, da diese Site nur anzeigt, wie vorzugehen ist, wenn Sie eine Probe haben. Vielleicht verstehe ich etwas Einfaches nicht, aber meine Verteilung hat einen viel kleineren Wert von Lambda (n), so dass ich die normale Näherung nicht verwenden kann und nicht weiß, wie ich den genauen Wert berechnen soll. Jede Hilfe wäre sehr dankbar. Vielen Dank!
Hier verwenden sie die Standardabweichung des Mittelwerts, oder? Das ist SE = sig/sqrt(N) = sqrt(lam/N)? Dies ist sinnvoll, da die Standardabweichung der Einzelwerte sigdie Wahrscheinlichkeit angibt, Zufallsstichproben aus der Poisson-Verteilung zu ziehen, während die SEoben definierte Wahrscheinlichkeit unser Vertrauen in lamdie Anzahl der Stichproben angibt, die wir zur Schätzung verwendet haben.
AlexG
17

In diesem Artikel werden 19 verschiedene Methoden zur Berechnung eines Konfidenzintervalls für den Mittelwert einer Poisson-Verteilung beschrieben.

http://www.ine.pt/revstat/pdf/rs120203.pdf

Tom
quelle
2
Trotz der Benachrichtigung des Mods hier, gefällt mir diese Antwort so wie sie ist, weil sie darauf hinweist, dass es keinen allgemeinen Konsens darüber gibt, wie ein gemessenes Poisson-System zu bewerten ist.
Carl Witthoft
7

Zusätzlich zu den Antworten, die andere gegeben haben, wird eine andere Herangehensweise an dieses Problem durch eine modellbasierte Herangehensweise erreicht. Der Ansatz des zentralen Grenzwertsatzes ist zweifellos gültig, und die Bootstrapped-Schätzungen bieten einen hohen Schutz vor Fehlern bei kleinen Stichproben und Modi.

Aus Gründen der Effizienz können Sie mithilfe eines auf einem Regressionsmodell basierenden Ansatzes ein besseres Konfidenzintervall für . Ableitungen müssen nicht durchgeführt werden, aber eine einfache Berechnung in R sieht folgendermaßen aus:λ

x <- rpois(100, 14)
exp(confint(glm(x ~ 1, family=poisson)))

Dies ist wohlgemerkt eine nicht symmetrische Intervallschätzung, da der natürliche Parameter des poisson glm die logarithmische relative Rate ist! Dies ist von Vorteil, da die Zähldaten tendenziell nach rechts verschoben werden.

Der obige Ansatz hat eine Formel und lautet:

exp(logλ^±1nλ^)

Dieses Konfidenzintervall ist "effizient" in dem Sinne, dass es aus der Maximum-Likelihood-Schätzung der natürlichen Parameter (log) für Poisson-Daten stammt und ein engeres Konfidenzintervall als das auf der Zählerskala basierende bereitstellt, während die nominelle Abdeckung von 95% beibehalten wird .

AdamO
quelle
+1 Ich denke, ich würde ein anderes Adjektiv als Effizienz verwenden (oder klarer, Sie meinen Computer- oder Code-Golf-Effizienz). Der Kommentar von whuber verweist auf eine Ressource, die genaue Intervalle angibt, und der glm-Ansatz basiert auch auf asymptotischen Ergebnissen. (Es ist jedoch allgemeiner, daher empfehle ich diesen Ansatz auch gerne.)
Andy W
μ
1
Was ist Ihre Autorität für diese Formel. Können wir zitieren?
Pauljohn32
@AndyW: Ihr Link ist nicht gültig für die schnelle Simulation
pauljohn32
1
@ pauljohn32 lies den Text von Casella Berger, insbesondere über die exponentielle Familie. Die logarithmische Rate ist der natürliche Parameter.
AdamO
5

Angesichts einer Beobachtung aus einer Poisson-Verteilung ,

  • Die Anzahl der gezählten Ereignisse ist n.
  • λσ2

Schritt für Schritt,

  • λ^=nλ
  • n>20σ

stderr=σ=λn

Nun ist das 95% Konfidenzintervall ,

I=λ^±1.96 stderr=n±1.96 n

[Bearbeitet] Einige Berechnungen basierend auf den Fragendaten,

  • λ

    Ich gehe von dieser Annahme aus, da die ursprüngliche Frage keinen Kontext zum Experiment oder zur Art der Datenerfassung enthält (was bei der Manipulation statistischer Daten von größter Bedeutung ist).

  • Das 95% -Konfidenzintervall ist im Einzelfall

I=λ±1.96 stderr=λ±1.96 λ=47.18182±1.96 47.18182[33.72,60.64]

Hence, as the measurement (n=88 events) is outside the 95% confidence interval, we conclude that,

  1. The process does not follow a Poisson process, or,

  2. The λ we have been given is not correct.


Important note: the first accepted answer above is wrong, as it incorrectly states that the standard error for a Poisson observation is λ/n. That is the standard error for a Sample Mean (Survey Sample) process.

jose.angel.jimenez
quelle
1
Welcome to the site! But @Travis "would like to know how confident I can be in my λ", so it should be a confidence interval around the sample mean. Besides, what do you mean by nλ, given they are 88 and 47 respectively?
Randel
2
Thanks! I have now edited the answer including some specific calculations. The question does not explain how λ and n have been obtained, so I made an educated guess. As you say, if n differs too much from λ is the first hint that the model may not be Poisson or the measurement was not done right. One way to check it is precisely calculating the 95% confidence interval which, in this case, shows n is outside the interval.
jose.angel.jimenez
2
I believe the response by jose.angel.jiminez above is incorrect, and arises from misreading the original question. The original poster stated "Observations (n) = 88" -- this was the number of time intervals observed, not the number of events observed overall, or per interval. The average number of events per interval, over the sample of 88 observing intervals, is the lambda given by the original poster. (I'd have included this as a comment to Jose's post, but am too new to the site to be allowed to comment.)
user44436
@user44436 added an answer that was supposed to be a comment. I repost it as a comment so that you can see it and because as a non-answer it may get removed: ------- I believe the response by jose above is incorrect and arises from misreading the original question. The original poster stated Observations (n) = 88 - this was the number of time intervals observed, not the number of events observed overall, or per interval. The average number of events per interval over the sample of 88 observing intervals is the lambda given by the original poster.
Mörre