Einerseits habe ich die Regression zum Mittelwert und andererseits habe ich den Trugschluss des Spielers .
Der Irrtum von Gambler wird von Miller und Sanjurjo (2019) definiert als "die irrtümliche Annahme, dass zufällige Sequenzen eine systematische Tendenz zur Umkehrung aufweisen, dh dass Streifen mit ähnlichen Ergebnissen eher enden als andauern". Zum Beispiel eine Münze, die um mehrere Köpfe gefallen ist Mal in Folge wird angenommen, dass es unverhältnismäßig wahrscheinlich ist, dass bei der nächsten Prüfung der Schwanz fällt.
Ich habe im letzten Spiel eine gute Leistung gezeigt und nach der Regression des Mittelwerts werde ich im nächsten Spiel wahrscheinlich eine schlechtere Leistung zeigen.
Aber entsprechend dem Irrtum des Spielers: Betrachten Sie die folgenden zwei Wahrscheinlichkeiten unter der Annahme einer fairen Münze
- Wahrscheinlichkeit von 20 Köpfen, dann 1 Schwanz =
- Wahrscheinlichkeit von 20 Köpfen, dann 1 Kopf =
Dann...
Stellen Sie sich ein einfaches Beispiel vor: Eine Klasse von Schülern führt einen 100-Punkte-Wahr / Falsch-Test zu einem Thema durch. Angenommen, alle Schüler wählen zufällig alle Fragen aus. Dann wäre die Punktzahl jedes Schülers die Verwirklichung einer von mehreren unabhängigen und identisch verteilten Zufallsvariablen mit einem erwarteten Mittelwert von 50.
Natürlich werden einige Schüler zufällig wesentlich über 50 und einige wesentlich unter 50 Punkte erzielen. Nimmt man nur die 10% der Schüler mit der höchsten Punktzahl und gibt ihnen einen zweiten Test, bei dem sie wieder nach dem Zufallsprinzip alle Punkte auswählen, wird wieder eine mittlere Punktzahl von etwa 50 erwartet.
Der Mittelwert dieser Schüler würde sich also auf den Mittelwert aller Schüler "zurückbilden", die die ursprüngliche Prüfung abgelegt haben. Unabhängig davon, welche Ergebnisse ein Schüler beim ursprünglichen Test erzielt, beträgt die beste Vorhersage für das Ergebnis beim zweiten Test 50.
Im Besonderen Wenn man nur die besten 10% der Schüler nimmt und ihnen einen zweiten Test gibt, bei dem sie wieder nach dem Zufallsprinzip alle Punkte auswählen, wird die mittlere Punktzahl wieder nahe 50 erwartet.
Sollte nach dem Irrtum des Spielers nicht mit der gleichen Wahrscheinlichkeit für die Wertung gerechnet werden und nicht unbedingt mit einer höheren Wahrscheinlichkeit nahe 50?
Miller, JB & Sanjurjo, A. (2019). Wie die Erfahrung den Irrtum des Spielers bestätigt, wenn die Stichprobengröße vernachlässigt wird.
quelle
Antworten:
Ich denke, die Verwirrung kann gelöst werden, wenn man bedenkt, dass der Begriff "Regression zum Mittelwert" wirklich nichts mit der Vergangenheit zu tun hat. Es ist lediglich die tautologische Beobachtung, dass wir bei jeder Iteration eines Experiments das durchschnittliche Ergebnis erwarten. Wenn wir also zuvor ein überdurchschnittliches Ergebnis hatten, erwarten wir ein schlechteres Ergebnis, oder wenn wir ein unterdurchschnittliches Ergebnis hatten, erwarten wir ein besseres Ergebnis. Der entscheidende Punkt ist, dass die Erwartung an sich nicht von der Vorgeschichte abhängt, wie dies beim Fehlschluss des Spielers der Fall ist.
quelle
the expectation itself does not depend on any previous history
undif we previously had an above average outcome then we expect a worse result
. Sie verwenden das Wort " erwarten" an beiden Orten und sprechen an beiden Orten über die Vergangenheit / Vorgeschichte .Wenn Sie sich in einer solchen Position befinden würden, als eine vernünftige Person (und unter der Annahme einer fairen Münze), wäre es Ihre beste Wette, nur zu raten. Wenn Sie sich in eine solche Position als abergläubische Spieler zu finden waren, die beste Wahl bei den früheren Veranstaltungen aussehen würde und versuchen , Ihre Argumentation über die Vergangenheit zu rechtfertigen - „Wow, Köpfe sind zB heiß !, Zeit zu ante“ oder " Wir werden auf keinen Fall einen anderen Kopf sehen - die Wahrscheinlichkeit für diese Art von Streifen ist unglaublich gering!".
Der Irrtum des Spielers ist nicht zu erkennen, dass jede einzelne 20-Münzen-Saite uns wahnsinnig unwahrscheinlich macht - zum Beispiel ist es sehr unwahrscheinlich, dass 10 Köpfe und dann 10 Schwänze umgedreht werden, sehr unwahrscheinlich, dass abwechselnde Köpfe und Schwänze umgedreht werden, sehr unwahrscheinlich, dass Vierer usw . Es ist auch sehr unwahrscheinlich HHTHHTTTHT Flip .. weil für jede Saite gibt es nur einen Weg für die von vielen vielen unterschiedlichen Ergebnissen geschehen heraus . Daher ist es ein Trugschluss, eines dieser Elemente als "wahrscheinlich" oder "unwahrscheinlich" zu bezeichnen, da alle gleich wahrscheinlich sind.
Die Regression auf den Mittelwert ist die zutreffende Überzeugung, dass Ihre Beobachtungen auf lange Sicht gegen einen endlichen Erwartungswert konvergieren sollten. Ich wette zum Beispiel, dass 10 von 20 Münzwürfen gut sind, weil es viele Möglichkeiten gibt, dies zu erreichen. Eine Wette auf 15 von 20 ist wesentlich unwahrscheinlicher, da es weit weniger Saiten gibt, die diese endgültige Zählung erreichen. Es ist erwähnenswert, dass, wenn Sie lange genug herumstehen und (faire) Münzen werfen, Sie letztendlich mit etwas enden, das ungefähr 50/50 ist - aber Sie werden nicht mit etwas enden, das keine "Streifen" oder andere unwahrscheinliche Folgen hat Ereignisse darin. Das ist der Kern des Unterschieds zwischen diesen beiden Konzepten.
TL; DR : Die Rückführung auf den Mittelwert besagt, dass Sie im Laufe der Zeit eine Verteilung erhalten, die die in jedem Experiment erwarteten Werte widerspiegelt. Der Irrtum des Spielers besagt (fälschlicherweise), dass jeder einzelne Münzwurf Erinnerungen an die vorherigen Ergebnisse hat, die sich auf das nächste unabhängige Ergebnis auswirken sollten.
quelle
Regression to the mean is the rightly-founded belief that in the long run, your observations should converge to a finite expected value
- Das ist der "Irrtum des Spielers" - dass nach einer Reihe von Köpfen, Schwänzen, jetzt wahrscheinlicher ist, weil es mit einer fairen Münze konvergieren würde ...Ich versuche immer daran zu denken, dass die Regression zum Mittelwert kein Ausgleichsmechanismus für die Beobachtung von Ausreißern ist.
Es gibt keine Ursache-Wirkungs-Beziehung zwischen einem herausragenden Spielverlauf und einem anschließenden 50: 50-Erfolg. Dies ist nur eine hilfreiche Methode, um sich daran zu erinnern, dass bei einer Stichprobe aus einer Verteilung Werte in der Nähe des Mittelwerts auftreten können (denken Sie daran, was Chebyshevs Ungleichung hier zu sagen hat).
quelle
Ein einfaches Beispiel: Sie haben beschlossen, insgesamt 200 Münzen zu werfen. Bis jetzt haben Sie 100 von ihnen geworfen, und Sie haben extrem viel Glück gehabt: 100% sind aufgetaucht (unglaublich, ich weiß, aber lassen Sie uns die Dinge einfach halten).
Bei 100 Köpfen in den 100 ersten Würfen erwarten Sie am Ende des Spiels insgesamt 150 Köpfe. Ein extremes Beispiel für den Irrtum des Spielers wäre die Annahme, dass Sie immer noch nur 100 Köpfe insgesamt erwarten (dh den erwarteten Wert vor Beginn des Spiels), selbst nachdem Sie 100 in den ersten 100 Würfen erhalten haben. Der Spieler glaubt trügerisch, dass die nächsten 100 Würfe Schwänze sein müssen. Ein Beispiel für eine Regression auf den Mittelwert (in diesem Zusammenhang) ist, dass Ihre Kopfquote von 100% voraussichtlich auf 150/200 = 75% (dh auf den Mittelwert von 50%) sinkt, wenn Sie das Spiel beenden.
quelle
Ich könnte mich irren, aber ich habe immer gedacht, dass der Unterschied in der Annahme der Unabhängigkeit liegt.
Im Irrtum des Spielers geht es um das Missverständnis von Unabhängigkeit. Sicher, über eine große Anzahl von N Münzwürfen werden Sie einen 50: 50-Split haben, aber wenn Sie das nicht sind, dann ist der Gedanke, dass Ihre nächsten T-Würfe helfen, die Chancen auszugleichen, falsch, da jeder Münzwurf unabhängig ist der Vorherige.
Die Regression auf den Mittelwert ist, soweit ich es als sinnvoll betrachte, eine Vorstellung davon, dass Ziehungen von vorherigen Ziehungen oder einem zuvor berechneten Durchschnitt / Werten abhängen. Verwenden Sie beispielsweise den prozentualen Anteil der NBA-Aufnahmen. Wenn Spieler A in seiner Karriere im Durchschnitt 40% seiner Schüsse abgegeben hat und zu Beginn des neuen Jahres in seinen ersten fünf Spielen 70% schießt, ist es vernünftig zu glauben, dass er auf den Durchschnitt seiner Karriere zurückfallen wird. Es gibt abhängige Faktoren, die sein Spiel beeinflussen können und werden: heiße / kalte Streifen, Teamkameradenspiel, Selbstvertrauen und die einfache Tatsache, dass er bei einem jährlichen Schießen von 70% mehrere Rekorde vernichten würde, die einfach unmöglich sind (unter den aktuellen Leistungsfähigkeiten von professionellen Basketballspielern). Wenn Sie mehr Spiele spielen, sinkt Ihr Schießanteil wahrscheinlich näher an Ihrem Karriere-Durchschnitt.
quelle
Der Schlüssel ist, dass wir keine Informationen haben, die uns beim nächsten Ereignis helfen (Spielertrugschluss), da das nächste Ereignis nicht vom vorherigen Ereignis abhängt. Wir können eine vernünftige Vorstellung davon machen, wie eine Reihe von Versuchen verlaufen wird. Diese vernünftige Schätzung ist der Durchschnitt, auch bekannt als unser erwartetes mittleres Ergebnis. Wenn wir also eine Abweichung des Mittelwerttrends im Verlauf der Zeit / Versuche zurück zum Mittelwert beobachten, dann erleben wir eine Regression zum Mittelwert.
Wie Sie sehen können, handelt es sich bei der Regression des Mittelwerts um eine Reihe von beobachteten Aktionen , jedoch nicht um eine Vorhersage. Wenn mehr Versuche durchgeführt werden, nähern sich die Dinge einer normalen / Gaußschen Verteilung an. Dies bedeutet, dass ich keine Vermutungen anstellen oder erraten kann, was das nächste Ergebnis sein wird. Unter Verwendung des Gesetzes der großen Zahlen kann ich theoretisieren, dass sich die Dinge im Laufe der Zeit ausgleichen werden, auch wenn sie derzeit in eine Richtung tendieren. Wenn sie sich ausgleichen, ist die Ergebnismenge auf den Mittelwert zurückgegangen. Es ist wichtig anzumerken, dass wir nicht sagen, dass zukünftige Studien von den Ergebnissen der Vergangenheit abhängen. Ich beobachte lediglich eine Veränderung des Datengleichgewichts.
Der Trugschluss des Spielers, wie ich ihn verstehe, ist in seinen Zielen unmittelbarer und konzentriert sich auf die Vorhersage zukünftiger Ereignisse. Dies verfolgt mit, was ein Spieler wünscht. Typischerweise sind Glücksspiele langfristig gegen den Spieler gerichtet, daher möchte ein Spieler wissen, was der nächste Versuch sein wird, weil er dieses Wissen nutzen möchte. Dies führt dazu, dass der Spieler fälschlicherweise annimmt, dass der nächste Versuch vom vorherigen Versuch abhängt. Dies kann zu neutralen Entscheidungen führen wie:
Oder die Wahl kann selbständig sein:
Wie Sie sehen, gibt es einige wesentliche Unterschiede:
Die Regression zum Mittelwert setzt nicht voraus, dass unabhängige Prozesse wie der Irrtum des Spielers abhängig sind.
Die Regression auf den Mittelwert wird auf eine große Menge von Daten / Versuchen angewendet, bei denen der Irrtum des Spielers mit dem nächsten Versuch zu tun hat.
Die Rückführung auf den Mittelwert beschreibt, was bereits stattgefunden hat. Der Irrtum von Gambler versucht, die Zukunft auf der Grundlage eines erwarteten Durchschnitts und vergangener Ergebnisse vorherzusagen.
quelle
Sind es Schüler mit höheren Noten, die auf Retest-Cheatern schlechter abschneiden?
Die Frage wurde seit der letzten von sechs Antworten umfangreich überarbeitet.
Oder sollten sie sich einfach vom Rouletterad fernhalten?
Glücksmünzen und Glückswürfe
Die Realität ist etwas komplizierter. Lassen Sie uns unser Modell aktualisieren. Erstens spielt es keine Rolle, wie die eigentlichen Antworten lauten, wenn wir nur Münzen werfen. Lassen Sie uns also einfach nach der Anzahl der Köpfe punkten. Bisher ist das Modell gleichwertig. Nehmen wir jetzt an1000 55% G 1000 45% B 1000 F ) und verteilen diese zufällig. Dies ist analog zu der Annahme höherer und niedrigerer Fähigkeiten / Kenntnisse im Testbeispiel, aber es ist einfacher, über unbelebte Objekte richtig zu urteilen.
Selbst wenn einige Münzen besser sind als andere, bedeutet die Zufälligkeit der Münzwürfe, dass die Auswahl der Leistungsträger aus einem Test immer noch eine gewisse Regression zum Mittelwert in einem erneuten Test zeigt. In diesem modifizierten Modell ist Heißhändigkeit kein völliger Trugschluss mehr - ein besseres Ergebnis in der ersten Runde bedeutet eine höhere Wahrscheinlichkeit, eine gute Münze zu haben! Der Fehlschluss von Spielern ist jedoch immer noch ein Fehlschluss - von denen, die Glück erlebt haben, kann nicht erwartet werden, dass sie beim erneuten Test mit Pech entschädigt werden.
quelle
Sie sagen dasselbe. Sie waren größtenteils verwirrt, weil kein einzelnes Experiment im Beispiel des Münzwurfs ein extremes Ergebnis hat (H / T 50/50). Ändern Sie die Einstellung in "in jedem Experiment zehn faire Münzen gleichzeitig werfen", und die Spieler möchten, dass alle richtig sind. Dann wäre eine extreme Messung, dass Sie zufällig sehen, dass alle von ihnen Köpfe sind.
Spielertrugschluss: Behandeln Sie jedes Spielergebnis (Münzwurfergebnis) als IID . Wenn Sie die Verteilung dieser IID-Anteile bereits kennen, sollte die nächste Vorhersage direkt von der bekannten Verteilung stammen und hat nichts mit historischen (oder zukünftigen) Ergebnissen (auch bekannt als andere IID) zu tun.
Regression zum Mittelwert: Behandeln Sie jedes Testergebnis als IID (da davon ausgegangen wird, dass der Schüler zufällig schätzt und keine wirklichen Fähigkeiten besitzt). Wenn Sie die Verteilung dieser IID-Anteile bereits kennen, stammt die nächste Vorhersage direkt von der bekannten Verteilung und hat nichts mit historischen (oder zukünftigen) Ergebnissen (auch bekannt als andere IID) zu tun ( genau wie zuvor bis hierher ). Aber von CLT , wenn man beobachtet extreme Werte in einer Messung (zB zufällig nur die oberen 10% Probenahme wurden Studenten aus dem ersten Test), sollten Sie das Ergebnis von Ihrer nächsten Beobachtung wissen / Messung wird nach wie vor von dem bekannten erzeugt werden Verteilung (und damit eher näher am Mittelwert als am Extrem).
Im Grunde genommen sagen beide, dass die nächste Messung von der Verteilung statt von früheren Ergebnissen ausgeht.
quelle
Sei X und Y zwei gleichförmige Zufallsvariablen auf [0,1]. Angenommen, wir beobachten sie nacheinander.
Gambler's Fallacy: P (Y | X)! = P (Y) Das ist natürlich Unsinn, weil X und Y unabhängig sind.
Regression zum Mittelwert: P (Y <X | X = 1)! = P (Y <X) Dies ist wahr: LHS ist 1, LHS <1
quelle
Vielen Dank für Ihre Antworten. Ich glaube, ich konnte den Unterschied zwischen der Regression zum Mittelwert und dem Irrtum des Spielers verstehen. Außerdem habe ich eine Datenbank erstellt, die mir hilft, den "echten" Fall zu veranschaulichen.
Ich habe diese Situation aufgebaut: Ich habe 1000 Schüler gesammelt und sie dazu gebracht, zufällig Fragen zu beantworten.
Die Testergebnisse reichen von 01 bis 05. Da die Fragen nach dem Zufallsprinzip beantwortet werden, besteht für jedes Ergebnis eine Chance von 20%, erreicht zu werden. Für den ersten Test sollte die Anzahl der Schüler mit einer Punktzahl von 05 etwa 200 betragen
(1.1)1000 ≤ 0 , 20
(1.2)200
Ich hatte 196 Schüler mit der Note 05, was den erwarteten 200 Schülern sehr nahe kommt.
Also habe ich diese 196 Schüler wiederholt, der Test wird mit 39 Schülern mit der Punktzahl 05 erwartet.
(2.1)196 ∗ 0 , 20
(2.2)39
Nun, nach dem Ergebnis habe ich 42 Studenten, was im Rahmen der Erwartungen liegt.
Für diejenigen, die Punktzahl 05 haben, setze ich sie ein, um den Test zu wiederholen und so weiter ...
Daher waren die erwarteten Zahlen:
Erwarteter RETEST 03
(3.1)42 ∗ 0 , 20
(3.2)8
(3.3) Ergebnisse (8)
Erwarteter RETEST 04
(4.1)8 ∗ 0 , 20
(4.2)1 , 2
(4.3) Ergebnisse (2)
Erwarteter RETEST 05
(4.1)2 ∗ 0 , 20
(4.2)0 , 1
(4.3) Ergebnisse (0)
Wenn ich einen Studenten erwarte, der viermal die Note 05 bekommt, werde ich mich der Wahrscheinlichkeit von stellen0 , 204 Wenn ich jedoch für einen Schüler erwarte, der fünfmal die Note 05 erhält, sollte ich mindestens 3.500 Stichproben haben, um in allen Tests 1,12 Schüler mit der Note 05 zu erhalten
(5.1.)0 , 205= 0 , 00032
(5.2.)0 , 00032 * 3500 = 1,2
Daher hat die Wahrscheinlichkeit, dass ein Schüler in allen 05 Tests die Note 05 erhält, nichts mit seiner letzten Note zu tun. Ich meine, ich muss die Wahrscheinlichkeit für jeden Test nicht einzeln berechnen. Ich muss nach diesen 05 Tests wie nach einem Ereignis suchen und die Wahrscheinlichkeit für dieses Ereignis berechnen.
quelle