Zum Spaß nehme ich einige Daten von Anrufen aus dem Callcenter, in dem ich arbeite, und versuche, Hypothesentests für sie durchzuführen, insbesondere die Anzahl der in einer Woche eingegangenen Anrufe, und verwende eine Poisson-Verteilung, um sie anzupassen. Aufgrund des Themas meines Jobs gibt es zwei Arten von Wochen. Rufen wir eine Woche an, in der ich davon ausgehe, dass es mehr Anrufe gibt, und außerhalb der Wochen, in denen ich davon ausgehe, dass es weniger gibt.
Ich habe die Theorie, dass das von außerhalb der Wochen (nennen wir es ) größer ist als dasjenige von außerhalb der Wochen (nennen wir es ).λ 1 λ 2
Die Hypothese, die ich testen möchte, lautet also
Ich weiß, wie man einen Parameter (sagen wir ), bin mir aber nicht sicher, wie ich 2 bei einem gegebenen Datensatz ausführen soll. Angenommen, ich nehme Daten im Wert von zwei Wochen von jedem und für die Off-Week und und für die On-Week. Kann mir jemand helfen, diese einfachere Version so zu durchlaufen, dass ich sie auf einen größeren Datensatz anwenden kann? Jede Hilfe wird geschätzt, danke.× 1 = 2 × 2 = 3 Y 1 = 2 Y 2 = 6
quelle
Antworten:
Beachten Sie, dass die Gleichheit normalerweise null ist (aus gutem Grund).
Abgesehen von diesem Thema werde ich einige Ansätze für einen Test dieser Art von Hypothese erwähnen
Dann sind unter der Null die erwarteten Anteile und wauswonw woffw . Sie können ganz einfach einen einseitigen Test des Anteils in den nächsten Wochen durchführen.
Es gibt andere Einstellungen.
quelle
Was ist mit dem GLM mit Poisson-Fehlerstruktur und Log-Link? Aber die Idee über Binomial kann mächtiger sein.
quelle
Ich würde es mit einem Poisson- oder Quasi-Poisson-GLM mit einer Präferenz für Quasi-Poisson oder negatives Binomial regeln.
Das Problem bei der Verwendung von traditionellem Poisson besteht darin, dass Varianz und Mittelwert gleich sein müssen, was sehr wahrscheinlich nicht der Fall ist. Das Quasi-Poisson oder NB schätzt die Varianz uneingeschränkt durch den Mittelwert.
Sie können dies in R sehr einfach tun.
Der GLM-Ansatz ist vorteilhaft und kann um zusätzliche Variablen (z. B. Monat des Jahres) erweitert werden, die sich auf das Anrufvolumen auswirken können.
Um es von Hand zu machen, würde ich wahrscheinlich eine normale Näherung und einen t-Test mit zwei Stichproben verwenden.
quelle
Wir beginnen mit der Maximum-Likelihood-Schätzung für den Poisson-Parameter, der der Mittelwert ist.
Jetzt können Sie einfach testenY¯−X¯∼N(λ1−λ2,λ1n1+λ2n2)
quelle
Ab Seite 125 der statistischen Testhypothese von Casella wird die Antwort auf die Art der von Ihnen formulierten Frage beschrieben. Ich habe einen Link zu einem PDF angehängt, das ich online als Referenz gefunden habe. Casellas statistische Testhypothese, dritte Ausgabe .
quelle