Regression zum Mittelwert gegen den Irrtum des Spielers

29

Einerseits habe ich die Regression zum Mittelwert und andererseits habe ich den Trugschluss des Spielers .

Der Irrtum von Gambler wird von Miller und Sanjurjo (2019) definiert als "die irrtümliche Annahme, dass zufällige Sequenzen eine systematische Tendenz zur Umkehrung aufweisen, dh dass Streifen mit ähnlichen Ergebnissen eher enden als andauern". Zum Beispiel eine Münze, die um mehrere Köpfe gefallen ist Mal in Folge wird angenommen, dass es unverhältnismäßig wahrscheinlich ist, dass bei der nächsten Prüfung der Schwanz fällt.

Ich habe im letzten Spiel eine gute Leistung gezeigt und nach der Regression des Mittelwerts werde ich im nächsten Spiel wahrscheinlich eine schlechtere Leistung zeigen.

Aber entsprechend dem Irrtum des Spielers: Betrachten Sie die folgenden zwei Wahrscheinlichkeiten unter der Annahme einer fairen Münze

Wahrscheinlichkeit von 20 Köpfen, dann 1 Schwanz = $0.5^{20} × 0.5 = 0.5^{21}$
Wahrscheinlichkeit von 20 Köpfen, dann 1 Kopf = $0.5^{20} × 0.5 = 0.5^{21}$

Dann...

Stellen Sie sich ein einfaches Beispiel vor: Eine Klasse von Schülern führt einen 100-Punkte-Wahr / Falsch-Test zu einem Thema durch. Angenommen, alle Schüler wählen zufällig alle Fragen aus. Dann wäre die Punktzahl jedes Schülers die Verwirklichung einer von mehreren unabhängigen und identisch verteilten Zufallsvariablen mit einem erwarteten Mittelwert von 50.

Natürlich werden einige Schüler zufällig wesentlich über 50 und einige wesentlich unter 50 Punkte erzielen. Nimmt man nur die 10% der Schüler mit der höchsten Punktzahl und gibt ihnen einen zweiten Test, bei dem sie wieder nach dem Zufallsprinzip alle Punkte auswählen, wird wieder eine mittlere Punktzahl von etwa 50 erwartet.

Der Mittelwert dieser Schüler würde sich also auf den Mittelwert aller Schüler "zurückbilden", die die ursprüngliche Prüfung abgelegt haben. Unabhängig davon, welche Ergebnisse ein Schüler beim ursprünglichen Test erzielt, beträgt die beste Vorhersage für das Ergebnis beim zweiten Test 50.

Im Besonderen Wenn man nur die besten 10% der Schüler nimmt und ihnen einen zweiten Test gibt, bei dem sie wieder nach dem Zufallsprinzip alle Punkte auswählen, wird die mittlere Punktzahl wieder nahe 50 erwartet.

Sollte nach dem Irrtum des Spielers nicht mit der gleichen Wahrscheinlichkeit für die Wertung gerechnet werden und nicht unbedingt mit einer höheren Wahrscheinlichkeit nahe 50?

Miller, JB & Sanjurjo, A. (2019). Wie die Erfahrung den Irrtum des Spielers bestätigt, wenn die Stichprobengröße vernachlässigt wird.

regression mean fallacy gambling Luis P.
quelle

5

Ich verstehe nicht, wie der Irrtum des Spielers mit den beiden von Ihnen berechneten Wahrscheinlichkeiten zusammenhängt. Können Sie genauer erklären, was Sie unter diesem Irrtum verstehen?

whuber

Soll Ihr Spiel die längste Folge von Köpfen haben?

AdamO

1

Ich würde wirklich eine Erklärung dafür lieben. Die bisherigen Antworten scheinen mich noch nicht aufgeklärt zu haben. Die Regression auf den Mittelwert scheint unabhängige Ereignisse abhängig zu machen. Vielleicht kann die Regression auf den Mittelwert nie für eine einzige Beobachtung verwendet werden, sie gilt nur, wenn ein Mittelwert vorliegt.

ICC97

28

Ich denke, die Verwirrung kann gelöst werden, wenn man bedenkt, dass der Begriff "Regression zum Mittelwert" wirklich nichts mit der Vergangenheit zu tun hat. Es ist lediglich die tautologische Beobachtung, dass wir bei jeder Iteration eines Experiments das durchschnittliche Ergebnis erwarten. Wenn wir also zuvor ein überdurchschnittliches Ergebnis hatten, erwarten wir ein schlechteres Ergebnis, oder wenn wir ein unterdurchschnittliches Ergebnis hatten, erwarten wir ein besseres Ergebnis. Der entscheidende Punkt ist, dass die Erwartung an sich nicht von der Vorgeschichte abhängt, wie dies beim Fehlschluss des Spielers der Fall ist.

dsaxton
quelle

Genau. Wenn im Zusammenhang mit diesem Q die Köpfe als "gutes Ergebnis" interpretiert werden können, folgt in den Beispielen des OP wahrscheinlich ein schlechteres Ergebnis nach einer Reihe von guten Ergebnissen und ein besseres Ergebnis nach einer Reihe von schlechten Ergebnissen .

Amöbe sagt Reinstate Monica

5

Es scheint, als würdest du dir selbst widersprechen. Du sagst the expectation itself does not depend on any previous historyund if we previously had an above average outcome then we expect a worse result. Sie verwenden das Wort " erwarten" an beiden Orten und sprechen an beiden Orten über die Vergangenheit / Vorgeschichte .

Erik

6

Es gibt keinen Widerspruch. Wir erwarten kein schlechteres Ergebnis, weil die Ergebnisse tatsächlich voneinander abhängig sind. Wir erwarten ein schlechteres Ergebnis, weil wir eines gesehen haben, das über unseren Erwartungen lag. Die Erwartung selbst ist konstant und ändert sich nicht, wenn man das vorherige Ergebnis sieht.

DSAXTON

@Erik Vielleicht könnte eine Umformulierung helfen, aber der zu beachtende Punkt ist, wie man die beiden Aspekte unterscheidet. Erstens erwarten wir ein durchschnittliches Ergebnis, oder eher glauben wir es am wahrscheinlichsten. Im Vergleich zu einem tatsächlichen Ergebnis kann diese Erwartung relativ gut oder schlecht sein, je nachdem, wie gut oder schlecht dieses Ergebnis im Verhältnis zu unseren Erwartungen war. Wir erhalten keine Informationen über die Zukunft! Wir vergleichen nur unsere tatsächlichen Ergebnisse mit einem Durchschnitt. (Dieser Kommentar ist jetzt überflüssig, aber ich

lasse

9

Keine Gegenstimme, denn Ihre Antwort leidet unter der Mehrdeutigkeit, die die Frage überhaupt erst ausgelöst hat. Was ist ein "schlechteres" Ergebnis nach einem überdurchschnittlichen Ergebnis? Das OP interpretiert es als "schlechter als der Durchschnitt" (eine Interpretation, die sich intuitiv richtig anfühlt, weil die Welt nur falsch ist), während eine Regression zum Mittelwert bedeutet, dass es "schlechter als die Geschichte" sein wird. Ohne diese Verwirrung zu beseitigen, ist Ihre (richtige) Antwort nur für diejenigen verständlich, die bereits die richtige Antwort kennen. Wenn Sie es in irgendeiner Form bearbeiten, erhalten Sie meine Zustimmung.

Rumtscho

17

Wenn Sie sich in einer solchen Position befinden würden, als eine vernünftige Person (und unter der Annahme einer fairen Münze), wäre es Ihre beste Wette, nur zu raten. Wenn Sie sich in eine solche Position als abergläubische Spieler zu finden waren, die beste Wahl bei den früheren Veranstaltungen aussehen würde und versuchen , Ihre Argumentation über die Vergangenheit zu rechtfertigen - „Wow, Köpfe sind zB heiß !, Zeit zu ante“ oder " Wir werden auf keinen Fall einen anderen Kopf sehen - die Wahrscheinlichkeit für diese Art von Streifen ist unglaublich gering!".

Der Irrtum des Spielers ist nicht zu erkennen, dass jede einzelne 20-Münzen-Saite uns wahnsinnig unwahrscheinlich macht - zum Beispiel ist es sehr unwahrscheinlich, dass 10 Köpfe und dann 10 Schwänze umgedreht werden, sehr unwahrscheinlich, dass abwechselnde Köpfe und Schwänze umgedreht werden, sehr unwahrscheinlich, dass Vierer usw . Es ist auch sehr unwahrscheinlich HHTHHTTTHT Flip .. weil für jede Saite gibt es nur einen Weg für die von vielen vielen unterschiedlichen Ergebnissen geschehen heraus . Daher ist es ein Trugschluss, eines dieser Elemente als "wahrscheinlich" oder "unwahrscheinlich" zu bezeichnen, da alle gleich wahrscheinlich sind.

Die Regression auf den Mittelwert ist die zutreffende Überzeugung, dass Ihre Beobachtungen auf lange Sicht gegen einen endlichen Erwartungswert konvergieren sollten. Ich wette zum Beispiel, dass 10 von 20 Münzwürfen gut sind, weil es viele Möglichkeiten gibt, dies zu erreichen. Eine Wette auf 15 von 20 ist wesentlich unwahrscheinlicher, da es weit weniger Saiten gibt, die diese endgültige Zählung erreichen. Es ist erwähnenswert, dass, wenn Sie lange genug herumstehen und (faire) Münzen werfen, Sie letztendlich mit etwas enden, das ungefähr 50/50 ist - aber Sie werden nicht mit etwas enden, das keine "Streifen" oder andere unwahrscheinliche Folgen hat Ereignisse darin. Das ist der Kern des Unterschieds zwischen diesen beiden Konzepten.

TL; DR : Die Rückführung auf den Mittelwert besagt, dass Sie im Laufe der Zeit eine Verteilung erhalten, die die in jedem Experiment erwarteten Werte widerspiegelt. Der Irrtum des Spielers besagt (fälschlicherweise), dass jeder einzelne Münzwurf Erinnerungen an die vorherigen Ergebnisse hat, die sich auf das nächste unabhängige Ergebnis auswirken sollten.

Derek Janni
quelle

1

Ist der Irrtum des Spielers also ein falsches Konzept? Ich konnte den Kern davon nicht verstehen. Entschuldigung

Luis P.

6

Der Irrtum des Spielers ist ... nun ... ein Irrtum. Es ist falsch, es ist schlechtes Denken. Die Regression zum Mittelwert ist jedoch reine Statistik :)

Derek Janni

1

Regression to the mean is the rightly-founded belief that in the long run, your observations should converge to a finite expected value

- Das ist der "Irrtum des Spielers" - dass nach einer Reihe von Köpfen, Schwänzen, jetzt wahrscheinlicher ist, weil es mit einer fairen Münze konvergieren würde ...

Izkata

2

@ Izkata Nicht ganz. Die Regression auf den Mittelwert besagt, dass sich bei einer großen Anzahl von Versuchen die Streifen auf beiden Seiten ungefähr ausgleichen sollten. Je mehr Versuche Sie durchführen, desto näher kommt der wahre Mittelwert dem, den Sie erzielen. Wenn Sie genug gewendet haben, um einen Streifen von 100 Köpfen zu erhalten, haben Sie wahrscheinlich auch Streifen von Schwänzen, um dies irgendwo in Ihrer Verteilung auszugleichen, da Streifen von Köpfen und Schwänzen gleich wahrscheinlich sind. Wichtig ist, dass bei der Regression auf den Mittelwert keine bestimmten Daten zugrunde gelegt werden, sondern nur aggregierte Werte, wenn die Stichprobengröße zunimmt.

Ethan

1

@Izkata Gamblers Irrtum behauptet, was mit einem bestimmten Ergebnis passieren wird. Die Regression zum Mittelwert gibt eine allgemeine Aussage darüber ab, was wir von vielen Ergebnissen erwarten würden.

Derek Janni

5

Ich versuche immer daran zu denken, dass die Regression zum Mittelwert kein Ausgleichsmechanismus für die Beobachtung von Ausreißern ist.

Es gibt keine Ursache-Wirkungs-Beziehung zwischen einem herausragenden Spielverlauf und einem anschließenden 50: 50-Erfolg. Dies ist nur eine hilfreiche Methode, um sich daran zu erinnern, dass bei einer Stichprobe aus einer Verteilung Werte in der Nähe des Mittelwerts auftreten können (denken Sie daran, was Chebyshevs Ungleichung hier zu sagen hat).

Sullysaurus
quelle

2

Yay Chebyshev! Großartiger Punkt!

Derek Janni

4

Ein einfaches Beispiel: Sie haben beschlossen, insgesamt 200 Münzen zu werfen. Bis jetzt haben Sie 100 von ihnen geworfen, und Sie haben extrem viel Glück gehabt: 100% sind aufgetaucht (unglaublich, ich weiß, aber lassen Sie uns die Dinge einfach halten).

Bei 100 Köpfen in den 100 ersten Würfen erwarten Sie am Ende des Spiels insgesamt 150 Köpfe. Ein extremes Beispiel für den Irrtum des Spielers wäre die Annahme, dass Sie immer noch nur 100 Köpfe insgesamt erwarten (dh den erwarteten Wert vor Beginn des Spiels), selbst nachdem Sie 100 in den ersten 100 Würfen erhalten haben. Der Spieler glaubt trügerisch, dass die nächsten 100 Würfe Schwänze sein müssen. Ein Beispiel für eine Regression auf den Mittelwert (in diesem Zusammenhang) ist, dass Ihre Kopfquote von 100% voraussichtlich auf 150/200 = 75% (dh auf den Mittelwert von 50%) sinkt, wenn Sie das Spiel beenden.

Adrian
quelle

1

@whuber dies ist nicht das klassische Beispiel für die Größe von Vätern und Söhnen, aber ich würde behaupten, dass es der Wikipedia-Definition entspricht: "Regression in Richtung (oder zum) Mittelwert ist das Phänomen, wenn eine Variable [z. B. Bruchköpfe beim Münzwurf] ist Bei der ersten Messung ist es extrem, und bei der zweiten Messung liegt es tendenziell näher am Durchschnitt "

Adrian

3

Seien Sie vorsichtig mit Wikipedia: Die einleitende Sprache soll nur eine heuristische Idee vermitteln, ist aber selten eine Definition. Ihr Zitat ist in der Tat weder eine Definition (weil es nicht angibt, was "extrem" bedeutet), noch ist es unter den meisten Interpretationen korrekt. Beispielsweise besteht für jede kontinuierliche Zufallsvariable genau eine

Chance, dass die zweite von zwei unabhängigen Versuchen weiter vom Mittelwert entfernt ist als die erste.

1 / 2

$1/2$

Whuber

1

Ich denke, eine klare Beschreibung des Fehlschlusses des Spielers und der Regression des Mittelwerts ist wichtiger als das Anbieten von Beispielen. Wenn nur die Beispiele angeführt werden, ist nicht klar, wie sie verstanden werden sollen oder in welcher Beziehung sie zu diesen beiden Themen stehen.

Whuber

1

Als jemand, der ähnlich den OP denkt, ist Ihr zweiter Absatz das einzige Beispiel in allen Antworten, das klar erklärt, worin der Unterschied besteht. Jetzt macht es mehr Sinn.

Izkata

1

@whuber Genau das tun die meisten anderen Antworten, und sie haben es für mich überhaupt nicht geklärt.

Izkata

2

Ich könnte mich irren, aber ich habe immer gedacht, dass der Unterschied in der Annahme der Unabhängigkeit liegt.

Im Irrtum des Spielers geht es um das Missverständnis von Unabhängigkeit. Sicher, über eine große Anzahl von N Münzwürfen werden Sie einen 50: 50-Split haben, aber wenn Sie das nicht sind, dann ist der Gedanke, dass Ihre nächsten T-Würfe helfen, die Chancen auszugleichen, falsch, da jeder Münzwurf unabhängig ist der Vorherige.

Die Regression auf den Mittelwert ist, soweit ich es als sinnvoll betrachte, eine Vorstellung davon, dass Ziehungen von vorherigen Ziehungen oder einem zuvor berechneten Durchschnitt / Werten abhängen. Verwenden Sie beispielsweise den prozentualen Anteil der NBA-Aufnahmen. Wenn Spieler A in seiner Karriere im Durchschnitt 40% seiner Schüsse abgegeben hat und zu Beginn des neuen Jahres in seinen ersten fünf Spielen 70% schießt, ist es vernünftig zu glauben, dass er auf den Durchschnitt seiner Karriere zurückfallen wird. Es gibt abhängige Faktoren, die sein Spiel beeinflussen können und werden: heiße / kalte Streifen, Teamkameradenspiel, Selbstvertrauen und die einfache Tatsache, dass er bei einem jährlichen Schießen von 70% mehrere Rekorde vernichten würde, die einfach unmöglich sind (unter den aktuellen Leistungsfähigkeiten von professionellen Basketballspielern). Wenn Sie mehr Spiele spielen, sinkt Ihr Schießanteil wahrscheinlich näher an Ihrem Karriere-Durchschnitt.

Marsenau
quelle

Ihre Erklärung der Regression zum Mittelwert klingt eher wie ein Schrumpfungsschätzer. Können Sie genau definieren, was Sie unter "Regression" verstehen?

Whuber

Ich folgte der Idee von "Das Phänomen tritt auf, weil die Ergebnisse der Schüler zum Teil durch die zugrunde liegenden Fähigkeiten und zum Teil durch Zufall bestimmt werden" aus Wikipedia. Ich verstehe zwar, dass es eine Wahrscheinlichkeit gibt, aber die Ergebnisse werden von einer zugrunde liegenden Fähigkeit bestimmt.

Marsenau

2

Vielen Dank für diese Klarstellung. Es ist nicht ersichtlich, wie diese Idee auf die Idee zutrifft, dass sich der Durchschnitt im Laufe der Karriere dem Karrieredurchschnitt nähert. Das klingt entweder nach einer Tautologie oder nach einer Version eines Gesetzes mit großen Zahlen. Tatsächlich klingt es schrecklich wie der Irrtum des Spielers selbst!

whuber

1

Oder Ihr Karriereschnitt steigt, um Ihre neuen Fähigkeiten zu erfüllen. :) Ich denke, es ist ein Fehler, das Wasser mit einer verbesserungsfähigen Fähigkeit zu trüben.

Erik

1

"Missverständnis der Unabhängigkeit" - das scheint der kritische Punkt zu sein. Die Regression auf den Mittelwert scheint unabhängige Ereignisse abhängig zu machen.

ICC97

2

Der Schlüssel ist, dass wir keine Informationen haben, die uns beim nächsten Ereignis helfen (Spielertrugschluss), da das nächste Ereignis nicht vom vorherigen Ereignis abhängt. Wir können eine vernünftige Vorstellung davon machen, wie eine Reihe von Versuchen verlaufen wird. Diese vernünftige Schätzung ist der Durchschnitt, auch bekannt als unser erwartetes mittleres Ergebnis. Wenn wir also eine Abweichung des Mittelwerttrends im Verlauf der Zeit / Versuche zurück zum Mittelwert beobachten, dann erleben wir eine Regression zum Mittelwert.

Wie Sie sehen können, handelt es sich bei der Regression des Mittelwerts um eine Reihe von beobachteten Aktionen , jedoch nicht um eine Vorhersage. Wenn mehr Versuche durchgeführt werden, nähern sich die Dinge einer normalen / Gaußschen Verteilung an. Dies bedeutet, dass ich keine Vermutungen anstellen oder erraten kann, was das nächste Ergebnis sein wird. Unter Verwendung des Gesetzes der großen Zahlen kann ich theoretisieren, dass sich die Dinge im Laufe der Zeit ausgleichen werden, auch wenn sie derzeit in eine Richtung tendieren. Wenn sie sich ausgleichen, ist die Ergebnismenge auf den Mittelwert zurückgegangen. Es ist wichtig anzumerken, dass wir nicht sagen, dass zukünftige Studien von den Ergebnissen der Vergangenheit abhängen. Ich beobachte lediglich eine Veränderung des Datengleichgewichts.

Der Trugschluss des Spielers, wie ich ihn verstehe, ist in seinen Zielen unmittelbarer und konzentriert sich auf die Vorhersage zukünftiger Ereignisse. Dies verfolgt mit, was ein Spieler wünscht. Typischerweise sind Glücksspiele langfristig gegen den Spieler gerichtet, daher möchte ein Spieler wissen, was der nächste Versuch sein wird, weil er dieses Wissen nutzen möchte. Dies führt dazu, dass der Spieler fälschlicherweise annimmt, dass der nächste Versuch vom vorherigen Versuch abhängt. Dies kann zu neutralen Entscheidungen führen wie:

Die letzten fünf Male ist das Rouletterad auf Schwarz gelandet, also setze ich das nächste Mal groß auf Rot.

Oder die Wahl kann selbständig sein:

Ich habe in den letzten 5 Händen ein Full House bekommen, also werde ich groß wetten, weil ich auf einer Siegesserie bin und nicht verlieren kann.

Wie Sie sehen, gibt es einige wesentliche Unterschiede:

Die Regression zum Mittelwert setzt nicht voraus, dass unabhängige Prozesse wie der Irrtum des Spielers abhängig sind.
Die Regression auf den Mittelwert wird auf eine große Menge von Daten / Versuchen angewendet, bei denen der Irrtum des Spielers mit dem nächsten Versuch zu tun hat.
Die Rückführung auf den Mittelwert beschreibt, was bereits stattgefunden hat. Der Irrtum von Gambler versucht, die Zukunft auf der Grundlage eines erwarteten Durchschnitts und vergangener Ergebnisse vorherzusagen.

Erik
quelle

1

Eigentlich glaube ich nicht, dass die Regression zum Mittelwert etwas mit dem Gesetz der großen Zahlen zu tun hat oder bedeutet, was Sie im ersten Satz sagen.

Amöbe sagt Reinstate Monica

@amoeba Wenn wir also vorhaben, 100 Mal eine Münze zu werfen und 20 Mal in die Probe zu werfen, haben wir 20 Köpfe. Am Ende des Prozesses haben wir 55 Köpfe. Ich versuche zu sagen, dass dies ein Beispiel für "Regression zum Mittelwert" wäre. Es begann einseitig, normalisierte sich aber mit der Zeit. Das Gesetz der großen Zahlen war eine andere Möglichkeit, die Idee auszudrücken, dass sich die Dinge über genügend Prüfungen hinweg durchschnittlich entwickeln. Dies ist das Gleiche, als würde sich ein anfängliches Ungleichgewicht im Laufe der Zeit ausgleichen oder sich zum Mittelwert zurückbilden.

Erik

1

Ich glaube, ich fange an, mit Ihren Schlüsseln den Kern dieser Themen zu verstehen, Erik. Schön! :) xxx

Luis P.

2

Sind es Schüler mit höheren Noten, die auf Retest-Cheatern schlechter abschneiden?

Die Frage wurde seit der letzten von sechs Antworten umfangreich überarbeitet.

$100$

Oder sollten sie sich einfach vom Rouletterad fernhalten?

$50\%$ $50\%$ $100$ $50$

$60\%$ $2.8\%$ $3000$ $60%$ $85$

$85$ $60\%$ $50\%$ von $100$ $60\%$ $2.8\%$ $2$ $85$ $2.8\% \cdot 85$ $60\%$

$50\%$ $100$ $50$ $50$

Glücksmünzen und Glückswürfe

Die Realität ist etwas komplizierter. Lassen Sie uns unser Modell aktualisieren. Erstens spielt es keine Rolle, wie die eigentlichen Antworten lauten, wenn wir nur Münzen werfen. Lassen Sie uns also einfach nach der Anzahl der Köpfe punkten. Bisher ist das Modell gleichwertig. Nehmen wir jetzt an $1000$ $55\%$ $G$ $1000$ $45\%$ $B$ $1000$ $F$ ) und verteilen diese zufällig. Dies ist analog zu der Annahme höherer und niedrigerer Fähigkeiten / Kenntnisse im Testbeispiel, aber es ist einfacher, über unbelebte Objekte richtig zu urteilen.

$(55 \cdot 1000 + 45 \cdot 1000 + 50 \cdot 1000)/3000 = 50$ $60\%$ $18.3\%$ $0.2\%$ $2.8\%$ $60\%$ $7.1\%$ $60\%$ $21$

$21$ $60\%$ $50\%$ $100$ nicht mehr! Nun können Sie es mit dem Bayes-Theorem herausarbeiten, aber da wir gleich große Gruppen verwendet haben, ist die Wahrscheinlichkeit, dass ein Münztyp zu einem Ergebnis kommt, (hier) proportional zur Wahrscheinlichkeit, dass der Ausgang zu einem bestimmten Münztyp kommt. Mit anderen Worten, es gibt eine $86\% = 18.3\%/(18.3\% + 0.2\% + 2.8\%)$ Chance, dass diejenigen, die mindestens 60% erzielten, eine gute Münze hatten, $1\% = 0.2\%/(18.3\% + 0.2\% + 2.8\%)$ hatte eine schlechte Münze und $13\%$ hatte eine faire Münze. Der erwartete Wert der Punkte bei erneutem Test ist daher $86\% \cdot 55 + 1\% \cdot 45 + 13\% \cdot 50 = 54.25$ aus $100$ . Dies ist zumindest niedriger als die tatsächlichen Ergebnisse der ersten Runde $60$ , aber höher als der erwartete Wert der Ergebnisse vor der ersten Runde, $50$ .

Selbst wenn einige Münzen besser sind als andere, bedeutet die Zufälligkeit der Münzwürfe, dass die Auswahl der Leistungsträger aus einem Test immer noch eine gewisse Regression zum Mittelwert in einem erneuten Test zeigt. In diesem modifizierten Modell ist Heißhändigkeit kein völliger Trugschluss mehr - ein besseres Ergebnis in der ersten Runde bedeutet eine höhere Wahrscheinlichkeit, eine gute Münze zu haben! Der Fehlschluss von Spielern ist jedoch immer noch ein Fehlschluss - von denen, die Glück erlebt haben, kann nicht erwartet werden, dass sie beim erneuten Test mit Pech entschädigt werden.

A. Webb
quelle

Ich habe gerade eine Idee. Ich werde dieses Modell simulieren und sehen, wie es funktioniert.

Luis P.

1

Sie sagen dasselbe. Sie waren größtenteils verwirrt, weil kein einzelnes Experiment im Beispiel des Münzwurfs ein extremes Ergebnis hat (H / T 50/50). Ändern Sie die Einstellung in "in jedem Experiment zehn faire Münzen gleichzeitig werfen", und die Spieler möchten, dass alle richtig sind. Dann wäre eine extreme Messung, dass Sie zufällig sehen, dass alle von ihnen Köpfe sind.

Spielertrugschluss: Behandeln Sie jedes Spielergebnis (Münzwurfergebnis) als IID . Wenn Sie die Verteilung dieser IID-Anteile bereits kennen, sollte die nächste Vorhersage direkt von der bekannten Verteilung stammen und hat nichts mit historischen (oder zukünftigen) Ergebnissen (auch bekannt als andere IID) zu tun.

Regression zum Mittelwert: Behandeln Sie jedes Testergebnis als IID (da davon ausgegangen wird, dass der Schüler zufällig schätzt und keine wirklichen Fähigkeiten besitzt). Wenn Sie die Verteilung dieser IID-Anteile bereits kennen, stammt die nächste Vorhersage direkt von der bekannten Verteilung und hat nichts mit historischen (oder zukünftigen) Ergebnissen (auch bekannt als andere IID) zu tun ( genau wie zuvor bis hierher ). Aber von CLT , wenn man beobachtet extreme Werte in einer Messung (zB zufällig nur die oberen 10% Probenahme wurden Studenten aus dem ersten Test), sollten Sie das Ergebnis von Ihrer nächsten Beobachtung wissen / Messung wird nach wie vor von dem bekannten erzeugt werden Verteilung (und damit eher näher am Mittelwert als am Extrem).

Im Grunde genommen sagen beide, dass die nächste Messung von der Verteilung statt von früheren Ergebnissen ausgeht.

Yey
quelle

Dies ist keine korrekte Angabe des zentralen Grenzwertsatzes. Es ist lediglich eine Aussage darüber, was ein unabhängiges Ereignis ist.

AdamO

0

Sei X und Y zwei gleichförmige Zufallsvariablen auf [0,1]. Angenommen, wir beobachten sie nacheinander.

Gambler's Fallacy: P (Y | X)! = P (Y) Das ist natürlich Unsinn, weil X und Y unabhängig sind.

Regression zum Mittelwert: P (Y <X | X = 1)! = P (Y <X) Dies ist wahr: LHS ist 1, LHS <1

anonym
quelle

0

Vielen Dank für Ihre Antworten. Ich glaube, ich konnte den Unterschied zwischen der Regression zum Mittelwert und dem Irrtum des Spielers verstehen. Außerdem habe ich eine Datenbank erstellt, die mir hilft, den "echten" Fall zu veranschaulichen.

Ich habe diese Situation aufgebaut: Ich habe 1000 Schüler gesammelt und sie dazu gebracht, zufällig Fragen zu beantworten.

Die Testergebnisse reichen von 01 bis 05. Da die Fragen nach dem Zufallsprinzip beantwortet werden, besteht für jedes Ergebnis eine Chance von 20%, erreicht zu werden. Für den ersten Test sollte die Anzahl der Schüler mit einer Punktzahl von 05 etwa 200 betragen

(1.1) $1000*0,20$

(1.2) $200$

Ich hatte 196 Schüler mit der Note 05, was den erwarteten 200 Schülern sehr nahe kommt.

Also habe ich diese 196 Schüler wiederholt, der Test wird mit 39 Schülern mit der Punktzahl 05 erwartet.

(2.1) $196*0,20$

(2.2) $39$

Nun, nach dem Ergebnis habe ich 42 Studenten, was im Rahmen der Erwartungen liegt.

Für diejenigen, die Punktzahl 05 haben, setze ich sie ein, um den Test zu wiederholen und so weiter ...

Daher waren die erwarteten Zahlen:

Erwarteter RETEST 03

(3.1) $42*0,20$

(3.2) $8$

(3.3) Ergebnisse (8)

Erwarteter RETEST 04

(4.1) $8*0,20$

(4.2) $1,2$

(4.3) Ergebnisse (2)

Erwarteter RETEST 05

(4.1) $2*0,20$

(4.2) $0,1$

(4.3) Ergebnisse (0)

Wenn ich einen Studenten erwarte, der viermal die Note 05 bekommt, werde ich mich der Wahrscheinlichkeit von stellen $0,20^4$ Wenn ich jedoch für einen Schüler erwarte, der fünfmal die Note 05 erhält, sollte ich mindestens 3.500 Stichproben haben, um in allen Tests 1,12 Schüler mit der Note 05 zu erhalten

(5.1.) $0,20^5 = 0,00032$

(5.2.) $0,00032 * 3500 = 1.2$

Daher hat die Wahrscheinlichkeit, dass ein Schüler in allen 05 Tests die Note 05 erhält, nichts mit seiner letzten Note zu tun. Ich meine, ich muss die Wahrscheinlichkeit für jeden Test nicht einzeln berechnen. Ich muss nach diesen 05 Tests wie nach einem Ereignis suchen und die Wahrscheinlichkeit für dieses Ereignis berechnen.

Luis P.
quelle

Regression zum Mittelwert gegen den Irrtum des Spielers

Antworten:

Sind es Schüler mit höheren Noten, die auf Retest-Cheatern schlechter abschneiden?

Oder sollten sie sich einfach vom Rouletterad fernhalten?

Glücksmünzen und Glückswürfe

Erwarteter RETEST 03

Erwarteter RETEST 04

Erwarteter RETEST 05