In einem Webinar eines A / B-Testunternehmens wurde der ansässige "Data Scientist" erklärt, dass Sie Ihre Ergebnisse validieren sollten, indem Sie das Experiment erneut ausführen. Die Prämisse war, dass bei Auswahl von 95% Konfidenz eine Wahrscheinlichkeit von 5% (1/20) für ein falsches Positiv besteht. Wenn Sie Ihr Experiment mit denselben Einschränkungen erneut ausführen, gibt es jetzt 1/400 (ich gehe davon aus, dass dies 0,05 ^ 2 = 1/400 ist).
Ist das eine gültige Aussage? (dh "zweimal laufen, zwei statistische Signifikanz gewinnt = 1/400 Wahrscheinlichkeit eines falsch positiven")? Wäre es ein besserer Ansatz gewesen, Ihr Signifikanzniveau zu erhöhen?
Aus geschäftlicher Sicht besteht mein Anliegen darin, dass Sie durch erneutes Ausführen des Experiments mehr Benutzer einer minderwertigen Seite (Behandlung) aussetzen und somit potenzielle Verkäufe verlieren.
Antworten:
Wenn ich die Wahrscheinlichkeiten eines falschen Positivs für den Moment ignoriere, würde ich es so betrachten:
In beiden Fällen sollten Sie dann ein drittes Experiment durchführen, um sicherzugehen. Dies ist möglicherweise in Ordnung für Experimente, die relativ kostengünstig sind, aber bei potenziell hohen Kosten (z. B. Kundenverlust) müssen Sie den Nutzen wirklich berücksichtigen.
Wenn Sie sich die Wahrscheinlichkeiten ansehen, besteht beim ersten Ausführen des Experiments eine Wahrscheinlichkeit von 1/20 für ein falsches Positiv. Wenn Sie das Experiment zum zweiten Mal ausführen, besteht immer noch eine 1/20 Chance auf ein falsches Positiv (stellen Sie sich vor, Sie würfeln mit einem Würfel, bei dem jeder Wurf eine 1/6 Chance hat, eine bestimmte Zahl zu erhalten). Es besteht nur eine Wahrscheinlichkeit von 1/400, dass zwei Fehlalarme hintereinander auftreten.
Das eigentliche Problem besteht darin, eine genau definierte Hypothese mit strengen Verfahren zu haben und eine Stichprobengröße, einen Fehlergrad und ein Konfidenzintervall zu haben, mit denen Sie leben oder die Sie sich leisten können. Die Wiederholung des Experiments sollte der Erforschung überlassen bleiben
eher als zweite Vermutungsergebnisse. Obwohl es leichter gesagt als getan ist, dies den Managern zu erklären.
quelle
Ja, diese Aussage ist richtig, vorausgesetzt, Ihr Experiment ist ideal. Aber ein ideales Experiment zu bekommen ist viel schwieriger, als dieses Gefühl Glaubwürdigkeit verleiht. Daten aus der "realen Welt" sind chaotisch, kompliziert und in erster Linie schwer zu interpretieren. Es gibt enormen Raum für fehlerhafte Analysen, versteckte Variablen (es gibt sehr selten "dieselben Einschränkungen") oder Missverständnisse zwischen einem Datenwissenschaftler, der seine Arbeit erledigt, und einem Markierungsmanager, der seine Arbeit erledigt.
Aus geschäftlicher Sicht eine gute Methodik sicherstellen und nicht zu zuversichtlich in den Ergebnissen sein; Eine schwierigere Herausforderung als Sie vielleicht denken. Sobald Sie diese erledigt haben, arbeiten Sie an diesen 5%.
quelle