Ich bin ein Softwareentwickler, der ein A / B-Testwerkzeug bauen möchte. Ich habe keine soliden Statistiken, habe aber in den letzten Tagen viel gelesen.
Ich folge der hier beschriebenen Methodik und werde die relevanten Punkte unten zusammenfassen.
Mit diesem Tool können Designer und Domain-Experten eine Website so konfigurieren, dass der unter einer bestimmten URL empfangene Datenverkehr auf zwei oder mehr URLs aufgeteilt wird. Beispielsweise kann der auf http://example.com/hello1 eingehende Datenverkehr zwischen http://example.com/hello1 und http://example.com/hello2 aufgeteilt werden . Der Datenverkehr wird gleichmäßig zwischen den Ziel-URLs aufgeteilt, und die Leistung der Marketingprozesse an den einzelnen Ziel-URLs wird verglichen.
In diesem Experiment entspricht die Stichprobengröße N
den Besuchern. Der Test misst "Conversions", ein Begriff, der beschreibt, wann sich ein Besucher zu einer bestimmten Aktion in einem Marketingprozess verpflichtet. Conversions werden in Prozent angegeben, und eine höhere Conversion-Rate ist wünschenswert. Dies macht den Test zu einem Vergleich unabhängiger Proportionen. Das Tool muss leicht einsetzbar sein, um Tests mit sicheren Ergebnissen zu erstellen. Es N
ist wichtig, einen geeigneten Wert für auszuwählen.
In dem oben verlinkten Artikel wird eine Potenzanalyse mit zwei unabhängigen Proportionen angewendet, um herauszufinden N
. Diese Methode erfordert, dass man die Conversion-Rate der Kontrolle im Voraus kennt und die angestrebte Conversion-Verbesserung spezifiziert. Es gibt auch ein Signifikanzniveau von 95% und eine statistische Aussagekraft von 80% an.
Fragen:
- Ist dies eine Methode zur Bestimmung des
N
Tons? Wenn ja, wie lässt sich die Conversion-Rate der Kontrolle vor Beginn des Tests am sichersten bestimmen? - Gibt es fundierte Möglichkeiten zur Ermittlung
N
, die es nicht erfordern, die Umrechnungskurse der Steuerung im Voraus zu kennen? - Ist die Methodik im verlinkten Artikel korrekt? Wenn nicht, gibt es irgendwelche zugänglichen und leicht verdaulichen Methoden, mit denen Sie mich verlinken könnten?
IMHO, so weit es geht, geht die Post in die richtige Richtung. Jedoch:
Die vorgeschlagene Methode geht implizit von zwei Annahmen aus: der Basiskonversionsrate und dem erwarteten Änderungsbetrag. Die Stichprobengröße hängt stark davon ab, wie gut Sie diese Annahmen erfüllen. Ich empfehle Ihnen, die erforderlichen Stichprobengrößen für mehrere Kombinationen von p1 und p2 zu berechnen, die Sie für realistisch halten. Dadurch erhalten Sie ein Gefühl dafür, wie zuverlässig die Stichprobenberechnung tatsächlich ist.
Wenn die tatsächliche Conversion-Rate 9% statt 10% beträgt, sind für jedes Szenario weitere 2000 Fälle erforderlich, um die Conversion-Rate zu ermitteln, die 10% über der Basislinie des neuen Formulars liegt.
Nach Abschluss des Tests können Sie anhand Ihrer tatsächlichen Beobachtungen Konfidenzintervalle für die Anteile berechnen.
sig.level
quelle
Anstatt überlappende Intervalle zu berechnen, berechnen Sie den Z-Score. Dies ist algorithmisch einfacher zu implementieren, und Sie erhalten statistische Bibliotheken zur Unterstützung.
Schauen Sie sich das an: https://onlinecourses.science.psu.edu/stat200/node/53
quelle