Wir testen eine E-Mail-Marketingkampagne. Bei unserem ersten Test haben wir zwei verschiedene E-Mail-Typen verschickt und hatten eine dritte Kontrollgruppe, die keine E-Mail erhalten hat. Jetzt erhalten wir "Ergebnisse" als Anteil der Benutzer zurück, die zu unserer App zurückgekehrt sind. Hier sind die Ergebnisse:
Group | received e-mail | returned | %-returned
A | 16,895 | 934 | 5.53%
B | 17,530 | 717 | 4.09%
C | 42408 | 1618 | 3.82%
Es sieht so aus, als wäre Gruppe A tatsächlich besser als B und C, aber was ist der richtige Test, um dies zu zeigen?
Antworten:
In einer Tabelle wie dieser können Sie die durch einen G-Test erstellte G-Statistik partitionieren, anstatt die ORs zu berechnen oder eine logistische Regression auszuführen. Obwohl Sie entscheiden müssen, wie Sie es partitionieren wollen. Hier ist die G-Statistik, die Pearsons X ^ 2 ähnlich ist und auch einer X ^ 2-Verteilung folgt, wie folgt:
G = 2 * Summe (OBS * ln (OBS / EXP)).
Sie berechnen dies zunächst für die Gesamttabelle, in diesem Fall: G = 76,42 auf 2 df, was hoch signifikant ist (p <0,0001). Das heißt, die Rücklaufquote hängt von der Gruppe ab (A, B oder C).
Da Sie dann 2 df haben, können Sie zwei kleinere 1 df (2x2) G-Tests durchführen. Nach dem Ausführen der ersten Ebene müssen Sie jedoch die Zeilen der beiden im ersten Test verwendeten Ebenen reduzieren und diese Werte dann verwenden, um sie mit der dritten Ebene zu testen. Nehmen wir an, Sie testen zuerst B gegen C.
Dies ergibt einen G-stat von 2,29 auf 1 df, was nicht signifikant ist (p = 0,1300). Erstellen Sie dann eine neue Tabelle und kombinieren Sie die Zeilen B und C. Testen Sie nun A gegen B + C.
Dies ergibt einen G-stat von 74,13 auf 1 df, was ebenfalls hoch signifikant ist (p <0,0001).
Sie können Ihre Arbeit überprüfen, indem Sie die beiden kleineren Teststatistiken hinzufügen, die der größeren Teststatistik entsprechen sollten. Es tut: 2,29 + 74,13 = 76,42
Die Geschichte hier ist, dass sich Ihre B- und C-Gruppen nicht wesentlich unterscheiden, aber dass Gruppe A eine höhere Rücklaufquote aufweist als B und C zusammen.
Ich hoffe, das hilft!
Sie hätten den G-stat auch anders partitionieren können, indem Sie zuerst A mit B, dann C mit A + B oder A mit C und dann B mit A + C verglichen hätten. Darüber hinaus können Sie dies auf 4 oder mehr Gruppen erweitern. Nach jedem Test müssen Sie jedoch die beiden soeben getesteten Zeilen reduzieren, wobei die maximale Anzahl von Tests dem df in Ihrer ursprünglichen Tabelle entspricht. Es gibt andere Möglichkeiten, mit komplizierteren Tabellen zu partitionieren. Agrestis Buch "Categorical Data Analysis" sollte die Details enthalten. Insbesondere sein Kapitel über Inferenz für Zwei-Wege-Kontingenztabellen.
quelle
Ich würde einfach die Quoten- (oder Risiko-) Verhältnisse zwischen Gruppe A und B, zwischen B und C sowie zwischen A und C berechnen und prüfen, ob sie sich statistisch unterscheiden. Ich sehe in diesem Fall keinen Grund, einen "Omnibus" -Proportionstest durchzuführen, da Sie nur drei Gruppen haben. Drei Chi-Quadrat-Tests könnten ebenfalls den Trick machen.
Wie einige der Personen in den Kommentaren unten dargelegt haben, würde auch eine logistische Regression mit geplanten Kontrasten gut funktionieren.
quelle