Testen Sie, ob Personen nach wiederholten Verlusten Wetten abbrechen oder verringern

10

Ich habe Daten über eine Reihe von Gewinn- und Verlustwetten über 5 Wettrunden mit Abrieb nach jeder Runde. Ich verwende einen Entscheidungsbaum wie den folgenden, um die Daten anzuzeigen.

Geben Sie hier die Bildbeschreibung ein

Die Knoten am oberen Rand des Baums sind diejenigen, die gewinnende Wetten haben, und diejenigen am unteren Rand des Baums haben Läufe, bei denen Wetten verloren gehen. Ich möchte (a) Abrieb an jedem Knoten (b) Änderungen der mittleren Einsatzgrößen an jedem Knoten betrachten. Ich betrachte die Abnutzungsrate an jedem Knoten des vorherigen Knotens und die Überlebensrate (unter Verwendung der erwarteten Anzahl von Personen an jedem Knoten, wenn die Wahrscheinlichkeit 50% beträgt). Wenn zum Beispiel die Wahrscheinlichkeit an jedem Knoten 50% beträgt, sollten sich von den 1000, die begonnen haben, ungefähr 500 Personen in jedem der zweiten Knoten W und L befinden. Die Hypothese lautet (a), dass die Abnutzungsrate nach dem Verlust höher ist Wetten (b) bedeutet, dass die Einsatzgröße nach Verlierern reduziert und nach Gewinnern erhöht wird.

Ich möchte dies zunächst nur in einer sehr einfachen univariaten Umgebung tun. Wie kann ich einen T-Test durchführen, um zu zeigen, dass die Änderung der mittleren Einsatzgröße von Knoten WW zu Knoten WWW statistisch signifikant ist, wenn 50 Personen ausgestiegen sind? Ich bin mir nicht sicher, ob dies der richtige Ansatz ist: Jede nachfolgende Wette ist unabhängig, aber die Leute fallen nach den Verlierern aus, sodass die Stichprobe nicht übereinstimmt. Wenn es nur ein Fall wäre, in dem dieselbe Klasse nacheinander eine Reihe von Prüfungen ablegt, ohne dass jemand abbricht, würde ich verstehen, wie man den entsprechenden T-Test durchführt, aber ich denke, das ist ein bisschen anders.

Wie kann ich das machen? Wie könnte ich die oberen 5% und unteren 5% herausnehmen, wenn die Ergebnisse von einer kleinen Anzahl von Kunden verzerrt werden? Entfernen Sie einfach die Kunden mit der höchsten kumulierten Einsatzgröße von Wette 1 - 3?

Ich habe die Daten, aus denen die Figur generiert wurde, also habe ich den Mittelwert, den Standardfehler, den Standardfehler usw. an jedem Knoten.

user2146441
quelle
1
Die Zeile, die WL sein sollte, trägt die Bezeichnung WW. Der Fehler breitet sich in dieser Zeile aus. Haben Sie nur diese Figur oder haben Sie die Daten, aus denen die Figur generiert wurde?
John
Ich versuche herauszufinden, ob es möglich ist, daraus zu erkennen, wo der Abrieb auftritt. Das N sind die Leute, die eine Wette gemacht haben, aber nicht die Leute, die tatsächlich dort angekommen sind. Zum Beispiel gehen 450 W, aber dann kommen 250 und 180 heraus. Also sind 20 weg, aber haben diese gewonnen oder verloren?
John
Ich habe die Daten, aus denen die Figur generiert wurde, ja. Seitdem habe ich den Baum bearbeitet, um den Fehler zu korrigieren, auf den Sie hingewiesen haben, und einen Teil des Endknotens geändert, um die Art der Abnutzung im realen Datensatz zu replizieren. Sie haben Recht, dass der Abrieb im Moment nicht klar ist. Ich werde den Baum in den nächsten Minuten erneut bearbeiten, um ein bisschen mehr Daten anzuzeigen. Vielen Dank.
user2146441

Antworten:

1

Es scheint fast "offensichtlich, wenn man hinschaut", dass Verlierer eher aussteigen als Gewinner.

Sie können eine Reihe von Kontingenztabellen ausprobieren, um festzustellen, ob die oben genannten Werte statistisch signifikant sind. Zum Beispiel fielen von den 450 Gewinnern der ersten Wette 25 aus und 425 blieben und von den 550 Verlierern fielen 150 aus und 400 blieben. Usw.

Emil Friedman
quelle
0

Diese Antwort wird wahrscheinlich etwas vom Thema abweichen, aber ich werde mit dem Thema beginnen. Wenn ich speziell gefragt würde, ob die Änderung der mittleren Einsatzgröße von WW zu WWW signifikant ist, würde ich die Personen ignorieren, die diese beiden Knoten nicht erreicht haben. Wenn das Ziel dieser Analyse darin besteht, Vorhersagen für zukünftiges Verhalten treffen zu können, sollte die Mechanik des Versuchs gut geeignet sein, die Mechanik zukünftigen Verhaltens zu emulieren, auch wenn das Spiel kein Glücksspiel ist. Was ist der Sinn der Messung, wie sich jemandes Wette von WW zu WWW ändern würde, wenn er nicht der Typ ist, der von WW zu WWW wechselt?

Abgesehen davon möchten wir bestimmte Bevölkerungsgruppen im Allgemeinen offensichtlich nicht systematisch ausschließen. Wenn ich diese Daten erhalten würde, würde ich mich auf die praktikableren Analysetypen konzentrieren. Vor allem (insbesondere wenn dies kein Glücksspiel ist) haben die Spieler an einem ähnlichen Knoten viel gemeinsam. Sie hatten die gleiche Sequenz von (W, L) und haben keine mehr. Die Beantwortung von Fragen im Sinne von "Wie wirkt sich der Verlust einer Spendenrunde auf die Einsatzgröße und den Abrieb aus?" Ist durchaus machbar, während das knotenabhängige Verhalten in Form eines mehrstufigen Modells kontrolliert wird.

Ein letzter Ratschlag wäre, sich von Runde zu Runde auf Unterschiede auf Spielerebene zu konzentrieren. Die durchschnittliche Wette, die nach einer Weile um 5 Cent sinkt, kann statistisch unbedeutend sein, während 90% der Wetten der Spieler wahrscheinlich sinken werden.

jlimahaverford
quelle