Poisson-Hypothesentest für zwei Parameter

9

Zum Spaß nehme ich einige Daten von Anrufen aus dem Callcenter, in dem ich arbeite, und versuche, Hypothesentests für sie durchzuführen, insbesondere die Anzahl der in einer Woche eingegangenen Anrufe, und verwende eine Poisson-Verteilung, um sie anzupassen. Aufgrund des Themas meines Jobs gibt es zwei Arten von Wochen. Rufen wir eine Woche an, in der ich davon ausgehe, dass es mehr Anrufe gibt, und außerhalb der Wochen, in denen ich davon ausgehe, dass es weniger gibt.

Ich habe die Theorie, dass das von außerhalb der Wochen (nennen wir es ) größer ist als dasjenige von außerhalb der Wochen (nennen wir es ).λ 1 λ 2λλ1λ2

Die Hypothese, die ich testen möchte, lautet alsoH0:λ1>λ2,H1:λ1λ2

Ich weiß, wie man einen Parameter (sagen wir ), bin mir aber nicht sicher, wie ich 2 bei einem gegebenen Datensatz ausführen soll. Angenommen, ich nehme Daten im Wert von zwei Wochen von jedem und für die Off-Week und und für die On-Week. Kann mir jemand helfen, diese einfachere Version so zu durchlaufen, dass ich sie auf einen größeren Datensatz anwenden kann? Jede Hilfe wird geschätzt, danke.× 1 = 2 × 2 = 3 Y 1 = 2 Y 2 = 6H0:λ1>1,H1:λ11X1=2X2=3Y1=2Y2=6

James Snyder
quelle
3
Sind die Anrufe wirklich verteilt? Wenn es viele Anrufe gibt, können sie am besten als ungefähr normal modelliert werden. Aber das kann den Spaß töten.
RegressForward
1
Nun, was bestimmt, wie Sie es richtig einrahmen? Ich erhalte x Anzahl diskreter Anrufe in einem Zeitrahmen. Ich könnte es sicher als Normalverteilung machen, aber der springende Punkt ist, dass ich es gerne mit Poisson versuchen würde, da es passt.
James Snyder
Wenn Sie annehmen, dass die Zählungen Poisson sind, können Sie einfach die Zählungen hinzufügen (korrigieren Sie mich, wenn ich falsch liege). Das heißt, Sie würden X = 2 + 3 und Y = 2 + 6 erhalten. Sie können dann mit dem ´poisson.test´ in R auf einen Unterschied testen. Wenn Sie eine Bayes'sche Analyse ausprobieren möchten, habe ich hier auch einen Blog-Beitrag dazu: sumsar.net/blog/2014/ 09 / Bayesian-Erste-Hilfe-Poisson-Test
Rasmus Bååth

Antworten:

4

Beachten Sie, dass die Gleichheit normalerweise null ist (aus gutem Grund).

Abgesehen von diesem Thema werde ich einige Ansätze für einen Test dieser Art von Hypothese erwähnen

  1. Ein sehr einfacher Test: Bedingung für die insgesamt beobachtete Anzahl , die sie in einen Binomialtest der Proportionen umwandelt. Stellen Sie sich vor, es gibt on- und off-week undw on w off wnwonwoffw Weeks zusammen.

Dann sind unter der Null die erwarteten Anteile und wauswonwwoffw . Sie können ganz einfach einen einseitigen Test des Anteils in den nächsten Wochen durchführen.

  1. Sie können einen einseitigen Test erstellen, indem Sie eine Statistik anpassen, die sich auf einen Likelihood-Ratio-Test bezieht. Die Z-Form des Wald-Tests oder eines Score-Tests kann zum Beispiel mit einem Schwanz durchgeführt werden und sollte für Largish gut funktionierenλ .

Es gibt andere Einstellungen.

Glen_b - Monica neu starten
quelle
1

Was ist mit dem GLM mit Poisson-Fehlerstruktur und Log-Link? Aber die Idee über Binomial kann mächtiger sein.

Ivan Kshnyasev
quelle
Derzeit ist dies eher ein Kommentar als eine Antwort. Wollten Sie es als Kommentar, als Frage zur Klärung oder als Antwort? Wenn letzteres der Fall ist, können Sie es zu mehr Antworten erweitern? Wir können es auch in einen Kommentar für Sie umwandeln.
Gung - Reinstate Monica
1

Ich würde es mit einem Poisson- oder Quasi-Poisson-GLM mit einer Präferenz für Quasi-Poisson oder negatives Binomial regeln.

Das Problem bei der Verwendung von traditionellem Poisson besteht darin, dass Varianz und Mittelwert gleich sein müssen, was sehr wahrscheinlich nicht der Fall ist. Das Quasi-Poisson oder NB schätzt die Varianz uneingeschränkt durch den Mittelwert.

Sie können dies in R sehr einfach tun.

# week on = 1, week off = 0
week.status <- c(1, 1, 0, 0)
calls <- c(2, 6, 2, 3)
model <- glm(calls ~ week.status, family = poisson())
# or change the poisson() after family to quasipoisson() 
# or use the neg binomial glm from the MASS package

Der GLM-Ansatz ist vorteilhaft und kann um zusätzliche Variablen (z. B. Monat des Jahres) erweitert werden, die sich auf das Anrufvolumen auswirken können.

Um es von Hand zu machen, würde ich wahrscheinlich eine normale Näherung und einen t-Test mit zwei Stichproben verwenden.

Iacobus
quelle
1

Wir beginnen mit der Maximum-Likelihood-Schätzung für den Poisson-Parameter, der der Mittelwert ist.

λ^1=Y¯  and  λ^2=X¯

Jetzt können Sie einfach testenY¯X¯N(λ1λ2,λ1n1+λ2n2)

(Y¯X¯)λ1λ2λ1n1+λ2n2

Z<Critical Value

Hemant Rupani
quelle
0

Ab Seite 125 der statistischen Testhypothese von Casella wird die Antwort auf die Art der von Ihnen formulierten Frage beschrieben. Ich habe einen Link zu einem PDF angehängt, das ich online als Referenz gefunden habe. Casellas statistische Testhypothese, dritte Ausgabe .

Nuzhi Meyen
quelle
Netter Zeiger, aber nur Link-Antworten werden bei Cross Validated nicht empfohlen. Könnten Sie die Auflösung in Ihrer Antwort skizzieren? Vielen Dank.
Xi'an
Tut mir leid, dass mir diese Regel nicht bekannt war. Danke, dass Sie mich informiert haben. :) Ich werde versuchen, so schnell wie möglich eine umfassende Antwort zu geben.
Nuzhi Meyen