Was ist die richtige Antwort, wenn wir die Frage „Beste Statistik aller Zeiten“ ändern?

8

Es gibt eine beliebte Frage namens "Beste Statistikfrage aller Zeiten".

Wenn Sie eine zufällige Antwort auf diese Frage wählen, wie hoch ist die Wahrscheinlichkeit, dass Sie richtig liegen?

A) 25% B) 50% C) 60% D) 25%

Diese Aufgabe ist nicht sehr schwierig, die richtige Antwort ist 0%. Aber wenn wir es so modifizieren:

Wenn Sie eine zufällige Antwort auf diese Frage wählen, wie hoch ist die Wahrscheinlichkeit, dass Sie richtig liegen?

A) 50% B) 25% C) 60% D) 50%

Was wird die richtige Antwort sein? Haben wir zwei richtige Antworten: 25% und 50% oder gibt es keine richtige Antwort, da bei diesen beiden richtigen Antworten die Wahrscheinlichkeit, die richtige Antwort zu wählen, tatsächlich 75% beträgt (aber wir haben nicht 75% auf dem Schreibtisch geschrieben )?

Apropos. Bleibt die Antwort 0% die richtige Antwort, in diesem Fall die dritte richtige Antwort?

Nick
quelle
1
Die Antwort hängt natürlich davon ab, wie die zufällige Auswahl getroffen wird. "Zufällig" bedeutet nicht immer "gleichmäßig zufällig" ...;)
MånsT
Nehmen wir an, "gleichmäßig zufällig". Die Logik hinter der ursprünglichen Frage war: Als Antwort haben 25% eine Wahrscheinlichkeit von 50%, ausgewählt zu werden, und eine Antwort von 50% und 60% haben eine Wahrscheinlichkeit von 25%, ausgewählt zu werden. Diese Antworten sind nicht korrekt. Die Antwort 0% ist richtig, da die Wahrscheinlichkeit, sie zu wählen, 0% beträgt.
Nick
2
Dieses Problem wurde vor einiger Zeit ausführlich auf math.SE analysiert.
Kardinal
4
@whuber: Hier ist der mit den meisten Stimmen . Es gab andere, aber vielleicht wurden sie geschlossen / zusammengelegt.
Kardinal
2
@ Cardinal Danke. Ich denke, ich bin froh zu sehen, dass es dort keine tiefen oder aufschlussreichen Antworten zu geben scheint (trotz der heftigen Abstimmung), weil dies bedeutet, dass hier möglicherweise Raum für weitere Exegese besteht :-).
whuber

Antworten:

11

Die offensichtlichen Paradoxien (der Logik oder der Wahrscheinlichkeit) können gelöst werden, indem die Fragen klar und sorgfältig formuliert werden.

Die folgende Analyse basiert auf der Idee , eine Antwort zu verteidigen : Wenn ein Testteilnehmer einen möglichen Sachverhalt (der mit allen verfügbaren Informationen übereinstimmt) aufweisen kann, in dem seine Antwort tatsächlich richtig ist, sollte sie als richtig markiert werden. Ebenso ist eine Antwort falsch, wenn keine solche Verteidigung existiert; es wird ansonsten als richtig angesehen. Dies modelliert die üblichen Interaktionen zwischen (wohlwollenden, rationalen) Gradern und (rationalen) Testteilnehmern :-). Das offensichtliche Paradoxon wird gelöst, indem für die zweite Frage mehrere solcher Verteidigungen gezeigt werden, von denen jeweils nur eine zutreffen könnte.


Ich werde die Bedeutung von "zufällig" in diesen Fragen im herkömmlichen Sinne nehmen: Um eine zufällige Auswahl der Antworten zu modellieren, schreibe ich jede Antwort auf einen Zettel ("Ticket") und lege sie in eine Schachtel: das wird sein Insgesamt vier Tickets. Das Ziehen eines Tickets aus der Schachtel (nachdem der Inhalt der Schachtel sorgfältig und blind gemischt wurde) ist ein physikalisches Modell für eine "zufällige" Auswahl. Es motiviert und begründet ein entsprechendes Wahrscheinlichkeitsmodell.

Was bedeutet es nun, "richtig zu sein"? In meiner Unwissenheit werde ich alle Möglichkeiten ausloten. Auf jeden Fall gehe ich davon aus, dass null, eins oder sogar mehr der Tickets "korrekt" sein können. (Woher weiß ich das? Ich konsultiere einfach das Bewertungsblatt!) Ich werde die "richtigen" Antworten als solche markieren, indem ich den Wert auf jedes richtige Ticket und auf die anderen schreibe . Das ist Routine und sollte nicht kontrovers sein.010

Eine offensichtliche, aber wichtige Sache, die zu beachten ist, ist, dass die Regel zum Schreiben von oder ausschließlich auf der Antwort basieren muss, die auf jedem Ticket geschrieben ist: Mathematisch gesehen handelt es sich um eine Zuordnung (oder Neuzuweisung), die den Satz der aufgelisteten Antworten sendet ( in beiden Fragen) in die Menge . Diese Regel wird für die Selbstkonsistenz benötigt.1 { .25 , .50 , .60 } { 0 , 1 }01{.25,.50,.60}{0,1}

Wenden wir uns dem probabilistischen Element der Frage zu: Per Definition ist die Chance, bei einer zufälligen Zeichnung von Tickets korrekt zu sein, die Erwartung der Werte, mit denen sie markiert wurden. Die Erwartung wird berechnet, indem die Werte auf den Tickets summiert und durch ihre Gesamtzahl dividiert werden. Es wird daher entweder , , , oder ..25 .50 .75 10.25.50.751

Eine Kennzeichnung ist sinnvoll, sofern nur die Tickets, deren Antworten der Erwartung entsprechen, mit s gekennzeichnet sind1 . Dies ist auch eine Selbstkonsistenzanforderung. Ich behaupte, dass dies der springende Punkt ist: die sinnvollen Markierungen zu finden und zu interpretieren. Wenn es keine gibt, kann die Frage selbst als bedeutungslos eingestuft werden. Wenn es eine eindeutige Kennzeichnung gibt, wird es keine Kontroversen geben. Nur wenn zwei oder mehr Markierungen sinnvoll sind, gibt es potenzielle Schwierigkeiten.

Welche Markierungen sind sinnvoll?

Wir müssen nicht einmal eine erschöpfende Suche durchführen. In der ersten Frage liegen die auf den Tickets aufgeführten Erwartungen bei 25%, 50% und 60%. Letzteres ist mit vier Tickets nicht möglich. Das erste würde erfordern, dass genau ein Ticket markiert wird; der zweite zwei Tickets. Das gibt höchstens mögliche Markierungen zum Erkunden. Die einzige sinnvolle Markierung setzt s auf jedes Ticket. Für diese Markierung beträgt die Erwartung . Das rechtfertigt die angegebene Antwort auf die erste Frage. (Die einzig richtige Antwort auf die erste Frage ist wohl, keine Antwort auszuwählen!)0 ( 0 + 0 + 0 + 0 ) / 4 = 03+3=60(0+0+0+0)/4=0

In der zweiten Frage erscheinen die gleichen Antworten und es gibt wieder sechs Markierungen zu erkunden. Diesmal sind drei Markierungen selbstkonsistent. Ich tabelliere sie:

Solution 1                Solution 2                Solution 3
Ticket Answer Mark        Ticket Answer Mark        Ticket Answer Mark
     A    50%    1             A    50%    0             A    50%    0
     B    25%    0             B    25%    1             B    25%    0
     C    60%    0             C    60%    0             C    60%    0
     D    50%    1             D    50%    0             D    50%    0

Daher gibt es im zweiten Problem drei verschiedene mögliche Definitionen von "richtig", die dazu führen, dass entweder A oder D korrekt sind (in Lösung 1) oder nur B korrekt ist (in Lösung 2) oder keine der Antworten korrekt ist (in Lösung 3).

Eine Möglichkeit, diesen Sachverhalt zu interpretieren, besteht darin, dass es für jede der Antworten A, B und D mindestens eine Möglichkeit gibt, die Tickets zu markieren, die diese Antworten korrekt machen. Dies bedeutet nicht , dass alle drei gleichzeitig korrekt sind: Sie könnten es nicht sein, weil . Wenn Sie der Bewerter des Tests wären, wenn Sie A, B oder D als richtig markiert hätten, würden Sie vom Testteilnehmer kein Argument erhalten. aber wenn Sie einen von ihnen als falsch markiert haben ,.25.50 Der Testteilnehmer hätte eine legitime Grundlage, um Ihre Bewertung zu bestreiten: Er würde entweder Lösung 1 oder Lösung 2 aufrufen. Wenn sich ein Testteilnehmer weigerte, die Frage zu beantworten, würde Lösung 3 ihm eine legitime Grundlage geben, um zu argumentieren, dass dies nicht der Fall ist -Antwort sollte auch volle Gutschrift bekommen!

Zusammenfassend geht diese Analyse auf den zweiten Teil der Frage ein, indem sie zu dem Schluss kommt, dass jede der folgenden Antworten auf Frage 2 als richtig markiert werden sollte, da jede von ihnen vertretbar ist : A, B, D, A und D und nichts. Keine andere Antwort kann verteidigt werden und wäre daher nicht korrekt.

whuber
quelle
1
Wie lautet Ihre Antwort auf Frage 2? Es scheint, als hätten Sie eine immens komplizierte Erklärung mit drei möglichen konsistenten Antworten gegeben. Ich behaupte immer noch, dass dies auf ein Problem mit der Definition von richtig hinweist.
Michael R. Chernick
2
@ Michael Danke: Ich habe einen Absatz hinzugefügt, um die Schlussfolgerungen vollkommen klar zu machen. Ich gebe zu, eine relativ lange Antwort verfasst zu haben (was möglicherweise durch die viel größere kollektive Länge der Antworten hier und auf der Mathe-Website gerechtfertigt ist). "Immens kompliziert" muss im Auge des Betrachters liegen: Ich habe daran gearbeitet, die Ideen so einfach wie möglich zu gestalten, damit die Leser leicht überprüfen können, ob ich nicht versuche, sie zu täuschen. Wenn andere behaupten, es gäbe ein "Paradoxon" oder eine "Frage in der Logik", ist es wichtig, einfach, klar und explizit zu sein, obwohl dies die Länge verlängern kann.
whuber
1
@ Michael Ich weiß das zu schätzen. Ich bin selbst ein wenig zurückhaltend in Bezug auf diese Lösung, weil die Leute mit der Idee nicht zufrieden sind, dass es mehrere richtige Antworten geben kann, um einfache Fragen zu klären. Ich lade zur kritischen Bewertung dieser Idee der "Verteidigungsfähigkeit" ein, um das scheinbare Paradoxon zu umgehen. Für mich scheint es ein origineller Weg zu sein, die negativen Schlussfolgerungen anderer zu umgehen (nämlich, dass die zweite Frage bedeutungslos, unsinnig oder unlogisch ist). Der Hauptwert der Untersuchung von Paradoxien liegt in der Förderung einer tieferen Untersuchung grundlegender Ideen.
whuber
1
Ah, das ist der Punkt, @Michael: Obwohl die drei widersprüchlich sind, ist jeder vertretbar. Ich habe die Verteidigung in der Erklärung geliefert, die zu den tabellarischen Lösungen führte. Lassen Sie uns hier praktisch werden: Stellen Sie sich vor, Sie sind Lehrer an einer Ivy League-Institution (wo Schüler und ihre Eltern in den letzten Jahren leider ziemlich streitig geworden sind) und haben solche Fragen im Rahmen einer Prüfung gestellt. Wie bewerten Sie sie? Meine Analyse schlägt einen Weg vor, der rational, objektiv, fair ist und Streitigkeiten zwischen Lehrer und Schüler vermeidet - auch wenn sich die Schüler untereinander unterscheiden können!
whuber
2
Es gibt Ihr Problem, @Michael: die Annahme, dass es eine eindeutige Antwort auf eine Multiple-Choice-Frage geben muss. (Sprechen Sie mit den Ärzten, die Sie kennen, und fragen Sie sie nach den Multiple-Choice-Fragen bei ihren Board-Zertifizierungsprüfungen: Zumindest in der Vergangenheit waren mehrere Antworten auf jede Frage korrekt.) Hier zeigt das Vorhandensein von zwei identischen Antworten auf die zweite Frage an Die Möglichkeit, dass mehr als eine Antwort auf eine Frage als richtig angesehen werden kann. / / An diesem Punkt scheinen wir in Gefahr zu sein, vom Problem abzuweichen. Wenn Sie also weitere Anmerkungen haben, starten Sie bitte einen Chatraum.
whuber
9

Ich denke, hier gibt es neben der Wahrscheinlichkeit auch ein Problem der Semantik. Die zufällige Auswahl ist klar. A, B, C und D werden jeweils zu 25% ausgewählt. Aber was bedeutet es, richtig zu sein, wenn Sie zufällig auswählen? Es scheint, dass es bedeuten sollte, dass Sie A als Antwort auswählen. Geben Sie als Antwort den richtigen Prozentsatz der Stichproben an, die für B, C und D korrekt und gleich sind. Sie müssen also 1/4 für jede richtige Antwort zählen und die Summe addieren alle richtigen Antworten, um den richtigen Prozentsatz zu erhalten. Dies führt jedoch zu einem Zirkelschluss. Daher das Paradoxon. Dies scheint eher eine Frage der Logik als der Wahrscheinlichkeit oder Statistik zu sein.

Michael R. Chernick
quelle
1
+1. Ich fragte mich: "Aber was bedeutet es, richtig zu sein ...?" Ich stimme zu, dass dies eher ein logisches Rätsel als eine Wahrscheinlichkeitsfrage zu sein scheint (obwohl ich gerne eine Erklärung von jemandem hören würde, warum diese Wahrnehmung falsch ist).
Makro
Die Logik hinter der ursprünglichen Frage war genau so, wie Sie es beschrieben haben. Da eine Antwort von 25% mit einer Wahrscheinlichkeit von 50% ausgewählt wird und eine Antwort von 50% und 60% mit einer Wahrscheinlichkeit von 25% ausgewählt wird, sind diese Antworten nicht korrekt. Die Antwort 0% ist richtig, da die Wahrscheinlichkeit, sie zu wählen, 0% beträgt. Dies erinnert an ein Zirkelargument, aber macht dies die Frage falsch?
Nick
@ Nick Ich glaube nicht. Ich denke, das Zirkelargument macht es unbestimmt. Sie können nicht sagen, welche Antworten richtig sind, und Sie können nicht sagen, welche Antworten falsch sind. 0% ist also nicht die Antwort. Die Frage kann nicht beantwortet werden. Vielleicht kann man sagen, dass 60% falsch sind, denn wenn es eine Antwort gäbe, müsste es ein Vielfaches von 1/4 sein.
Michael R. Chernick
1

whuber bietet eine großartige Analyse, bei der mehrere Antworten zulässig sind. Es gibt jedoch auch einen einheitlichen Weg, die Frage so zu verstehen, dass es nur eine einzige richtige Antwort gibt (obwohl wir dies als Teil der Frage angeben müssen):

Wenn Sie eine zufällige Antwort auf diese Frage auswählen, wie hoch ist die Wahrscheinlichkeit, dass Sie richtig liegen, da es nur eine einzige richtige Antwort gibt?

A) 50% B) 25% C) 60% D) 50%

{0,1}

Solution 1                Solution 2                Solution 3
Ticket Answer Mark        Ticket Answer Mark        Ticket Answer Mark
     A    50%    1             A    50%    0             A    50%    0
     B    25%    0             B    25%    1             B    25%    0
     C    60%    0             C    60%    0             C    60%    0
     D    50%    1             D    50%    0             D    50%    0

Wir brauchen jedoch einen weiteren logischen Schritt, um diese auf eine einzige vertretbare Antwort zu beschränken. Bei diesem Problem sah sich der Lehrer mit drei möglichen Markierungen konfrontiert, von denen jede eine ebenso akzeptable Einzelantwort sein konnte wie die anderen. Da jedoch nur eine Antwort richtig sein kann, sollte der Lehrer zufällig zwischen ihnen wählen. Dies weist jeder Markierung eine gleiche Wahrscheinlichkeit zu, so dass:

  • 1/350%
  • 1/325%
  • 1/30%

(50+25+0)/3=25

Zusammenfassung: Wenn wir angeben, dass es nur eine einzige richtige Antwort gibt, beträgt diese Antwort 25%.

WJ Zeng
quelle
Könnten Sie die Begründung für "Da jedoch nur eine Antwort richtig sein kann, sollte der Lehrer zufällig zwischen ihnen wählen" erklären? Ich verstehe nicht, warum zu diesem Zeitpunkt eine zufällige Auswahl erforderlich ist.
whuber
Natürlich ist es möglich, dass der Lehrer eine Art Voreingenommenheit hat, aber es gibt keinen Grund zu der Annahme, dass es eine gibt. In Ermangelung anderer Informationen denke ich, dass das Rationale vor der Annahme ist, dass die Wahl einer gleichmäßigen Verteilung folgt. Lassen Sie mich wissen, wenn dies falsch erscheint.
WJ Zeng
Ich weiß nicht, ob es falsch ist oder nicht, aber es "den rationalen Prior" zu nennen, scheint überhaupt keine Erklärung zu sein. Was mich stört, ist, dass die Angabe, dass es nur eine einzige richtige Antwort gibt, von Natur aus widersprüchlich sein kann. In diesem Fall ist keine vorherige Verteilung relevant. Darüber hinaus scheint der logische Umriss Ihres Arguments zu lauten: "Wenn wir davon ausgehen, dass es eine einzige richtige Antwort gibt und wir auch eine vorherige Verteilung auf die drei möglichen richtigen Antworten vornehmen, schließen wir, dass es eine eindeutige richtige Antwort gibt." Das sieht furchtbar kreisförmig aus, könnte aber vielleicht repariert werden.
whuber
0

Ich glaube die Antwort ist 1/3. Wir wissen nicht, welche Antwort (25%, 50% oder 60%) richtig ist. Jede Antwort, 25%, 50% und 60%, hat eine 1/3 Chance, korrekt zu sein, wenn sie ausgewählt wird. Obwohl 25% zweimal erscheinen, hat es immer noch eine Chance von 1/3, die richtige Antwort zu sein. Es spielt eigentlich keine Rolle, wie oft 25% als Antwort erscheinen. Wenn es 10 Mal zusammen mit 50% und 60% erscheint, beträgt die Wahrscheinlichkeit, dass es sich um die richtige Antwort handelt, immer noch 1/3. Dies setzt voraus, dass eine der Antworten richtig ist. Wenn die Möglichkeit besteht, dass keine der Antworten korrekt ist, lautet die Antwort 1/4. Dies basiert auf meiner Interpretation dessen, was die Frage stellt.

Jamie
quelle
1
Dieser Erklärungsversuch schlägt fehl, weil er Unwissenheit (wir wissen nicht, welche der drei Antworten richtig wäre) ungültig mit Wahrscheinlichkeit (Zuweisung von 1/3 zu jeder Antwort) in Konflikt bringt.
whuber