Bedeutung der Differenz zwischen zwei Zählungen

15

Gibt es eine Möglichkeit, festzustellen, ob ein Unterschied zwischen der Anzahl der Verkehrsunfälle zum Zeitpunkt 1 erheblich von der Anzahl zum Zeitpunkt 2 abweicht?

Ich habe verschiedene Methoden gefunden, um den Unterschied zwischen Beobachtungsgruppen zu verschiedenen Zeiten zu bestimmen (z. B. Vergleich der Poisson-Mittelwerte), aber nicht, um nur zwei Zählungen zu vergleichen. Oder ist es ungültig, es überhaupt zu versuchen? Jede Beratung oder Anleitung wäre dankbar. Ich bin glücklich, Leads selbst zu verfolgen.

Jessop
quelle

Antworten:

11

Wenn Sie davon ausgehen können, dass jede Zählung einer Poisson-Verteilung folgt (mit einem eigenen Mittelwert unter der Alternativhypothese; mit einem gemeinsamen Mittelwert unter der Null), ist dies kein Problem. Sie können diese Annahme nur nicht ohne Wiederholungen überprüfen. Überdispersion kann bei Zähldaten durchaus vorkommen.

Ein exakter Test mit den angegebenen Zählwerten und x 2 ist unkompliziert, da die Gesamtsumme der Zählwerte n = x 1 + x 2 von untergeordneter Bedeutung ist. Konditionierung darauf ergibt X 1B i n ( 1x1x2n=x1+x2als Verteilung Ihrer Teststatistik unter der Null. X1Bin(12,n) Es ist ein intuitives Ergebnis: Die Gesamtzählung gibt an, wie viel Zeit Sie möglicherweise für die Beobachtung der beiden Poisson-Prozesse aufwenden könnten. Sie enthält keine Informationen zu deren relativen Raten, wirkt sich jedoch auf die Leistung Ihres Tests aus. & daher sind andere Gesamtzählungen, die Sie haben könnten, irrelevant.

Siehe Likelihood-basierte Hypothesentests für den Wald-Test (eine Annäherung).

† Jeder Zählwert hat eine Poisson-Verteilung mit dem Mittelwert λ i f X ( x i ) = λ x i i e - λ ixiλi Reparametrisiere als θ

fX(xi)=λixieλixi!i=1,2
wobeiθ dasist, woran Sie interessiert sind, undϕein Störparameter ist. Die Gelenkmassenfunktion kann dann umgeschrieben werden: f X 1 , X 2 ( x 1 , x 2 )
θ=λ1λ1+λ2ϕ=λ1+λ2
θϕ Die Gesamtzahlnist fürθvonuntergeordneter Bedeutungund hat eine Poisson-Verteilung mit dem MittelwertϕfN(n).
fX1,X2(x1,x2)=λ1x1λ2x2e(λ1+λ2)x1!x2!fX1,N(x1,n)=θx1(1θ)nx1ϕneϕx1!(nx1)!
nθϕ
fN(n)=x1=0fX1,N(x1,n)=ϕneϕn!x1=0n!x1!(nx1)!θx1(1θ)nx1=ϕneϕn!
X1 gegeben n ist mit Bernoulli-Wahrscheinlichkeit binomisch θ& Nein. Versuchen
fX1|n(x1;n)=fX1,N(x1,n)fN(n)=θx1(1θ)nx1ϕneϕx1!(nx1)!n!ϕneϕ=n!x1!(nx1)!θx1(1θ)nx1
Scortchi - Reinstate Monica
quelle
The total number of counts is a complete sufficient statistic, isn't it? How can it be ancillary? Have I misunderstood something?
JohnK
@JohnK: The sufficient statistic is (X1,N), N being the ancillary complement to X1. Note the distribution of N doesn't depend on θ.
Scortchi - Reinstate Monica