Ist das Ergebnis einer Prüfung ein Binomial?

31

Hier ist eine einfache Statistikfrage, die mir gestellt wurde. Ich bin mir nicht sicher, ob ich das verstehe.

X = Anzahl der in einer Prüfung erworbenen Punkte (Multiple Choice und richtige Antwort sind ein Punkt). Ist X-Binomial verteilt?

Die Antwort des Professors war:

Ja, weil es nur richtige oder falsche Antworten gibt.

Meine Antwort:

Nein, denn jede Frage hat eine andere "Erfolgswahrscheinlichkeit" p. Wie ich verstanden habe, ist eine Binomialverteilung nur eine Reihe von Bernoulli-Experimenten, die jeweils ein einfaches Ergebnis (Erfolg oder Misserfolg) mit einer gegebenen Erfolgswahrscheinlichkeit p haben (und alle in Bezug auf p "identisch" sind). ZB 100 mal eine (faire) Münze werfen, das sind 100 Bernoulli-Experimente und alle haben p = 0,5. Aber hier haben die Fragen verschiedene Arten von p oder?

Paul
quelle
14
+1 Umso mehr auf den Punkt: Sofern dies keine seltsame Prüfung ist, sind die Antworten auf die Fragen stark korreliert. Wenn die Gesamtpunktzahl für eine Person ist, schließt dies eine Binomialverteilung aus. Könnte es möglich sein, dass die Frage unter der Annahme einer "Nullhypothese" betrieben wird, bei der alle Prüflinge alle Antworten unabhängig und zufällig erraten? X
whuber
2
Wie paradox, ich hätte mich zumindest für eine teilweise Anerkennung dafür eingesetzt, aber die "Antwort" scheint eine Abneigung gegen eine Vergabe zu widerspiegeln :) (Ich denke, Sie sind hier richtig).
AdamO
1
Ja, danke: D, ich denke, es ist eher eine Poisson-Binomialverteilung (wenn überhaupt)
Paul
2
Ich stimme allen zu, dass die Frage schlecht war, aber hier gibt es ein Problem mit der Gestaltung. Wenn dies ein Grundkurs ist und es sich um ein Kurzantwortformat handelt (damit Sie die Möglichkeit haben, Ihre Argumentation zu erläutern), würde ich sagen, dass die beste Antwort wahrscheinlich "Ja" ist (vorausgesetzt, Unabhängigkeit und gleiche Schwierigkeit für jede Frage). das würde dem Professor signalisieren, dass (1) Sie die Grenzen der Frage verstehen und (2) Sie nicht versuchen, ein kluger Arsch zu sein.
Ben Bolker

Antworten:

25

Ich würde Ihrer Antwort zustimmen. Normalerweise würde diese Art von Daten heutzutage mit einer Art Item Response Theory- Modell modelliert. Wenn Sie beispielsweise das Rasch-Modell verwenden , wird die binäre Antwort als modelliertXnich

Pr{Xnich=1}=eβn-δich1+eβn-δich

wo kann wie folgt beschrieben werden - ten Personen Fähigkeit und als - te Frage Schwierigkeit. Das Modell ermöglicht es Ihnen, die Tatsache zu erfassen, dass verschiedene Personen in ihren Fähigkeiten und Fragen in ihrem Schwierigkeitsgrad variieren. Dies ist das einfachste der IRT-Modelle.βnnδichich

Die Antwort Ihrer Professoren geht davon aus, dass alle Fragen dieselbe Wahrscheinlichkeit für "Erfolg" haben und unabhängig sind, da das Binom eine Verteilung einer Summe von iid Bernoulli-Versuchen ist. Die beiden oben beschriebenen Arten von Abhängigkeiten werden ignoriert.n

Wie in den Kommentaren bemerkt, wenn Sie sich die Verteilung der Antworten einer bestimmten Person ansehen (damit Sie sich nicht um die Variabilität zwischen Personen kümmern müssen), oder die Antworten verschiedener Personen auf dasselbe Element (damit es keine Zwischenfälle gibt). Itemvariabilität), dann wäre die Verteilung Poisson-binomial, dh die Verteilung der Summe von nicht-iid Bernoulli-Versuchen. Die Verteilung könnte mit binomial oder Poisson angenähert werden , aber das ist alles. Ansonsten machen Sie die iid-Annahme.n

Selbst unter der Annahme "null", dass es keine Vermutungsmuster gibt, wird davon ausgegangen, dass es keine Vermutungsmuster gibt. Die Menschen unterscheiden sich also nicht darin, wie sie raten, und die Gegenstände unterscheiden sich nicht darin, wie sie raten. Die Vermutung ist also rein zufällig.

Tim
quelle
Das macht Sinn! Obwohl ich vermute, Sie könnten die Wahrscheinlichkeit des Erfolgs einer Frage berechnen, aber die "Personenfähigkeit" klingt schwierig :) Eine andere Idee, die ich hatte, ist es, dies als Summe von Bernulli-Verteilungen zu modellieren? Angenommen, es gibt 2 Fragen, also 2 Erfolgswahrscheinlichkeiten p1 und p2. Analog zwei Variablen X1 und X2 zählen (also 2 Bernulli-Experimente). Dann ist zum Beispiel die Wahrscheinlichkeit, eine Gesamtpunktzahl von 1 zu erhalten, P (X1 = 1) · P (X2 = 0) + P (X1 = 0) · P (X2 = 1) = p1 (1 - p2) + (p1 -1) p2. Hört sich das vernünftig an?
Paul
2
@ Paul Summe von zwei Bernoulli mit verschiedenen p ist Poisson-Binomial
Tim
4
Die "Null" -Annahme ist im Grunde eine Kugel-Kuh-Sache, man kann sich immer darüber streiten, wie genau die Kugel der Kuh ist.
Hong Ooi
5

Die Antwort auf dieses Problem hängt von der Festlegung der Frage und dem Zeitpunkt ab, zu dem Informationen eingeholt werden. Insgesamt stimme ich dem Professor in der Regel zu, denke aber, dass die Erklärung seiner / ihrer Antwort schlecht ist und die Frage des Professors im Vorfeld mehr Informationen enthalten sollte.

Wenn Sie eine unendliche Anzahl möglicher Prüfungsfragen in Betracht ziehen und eine zufällig für Frage 1 zeichnen, zeichnen Sie eine zufällig für Frage 2 usw. Gehen Sie dann zur Prüfung:

  1. Jede Frage hat zwei Ergebnisse (richtig oder falsch)
  2. Es gibt eine feste Anzahl von Versuchen (Fragen)
  3. Jeder Versuch betrachtet werden könnte unabhängig (gehe in Frage zwei, Ihre Wahrscheinlichkeit es richtig zu bekommen ist das gleiche wie bei dem in Frage , die man zu gehen)p

In diesem Rahmen werden die Annahmen eines Binomialversuchs erfüllt.

Leider sind schlecht vorgeschlagene statistische Probleme in der Praxis sehr verbreitet, nicht nur bei Prüfungen. Ich würde nicht zögern, Ihre Begründung gegenüber Ihrem Professor zu verteidigen.

Underminer
quelle
Ja, ich denke, das ist auch richtig. Die Frage ist nur "schlecht", da man sich in beide Richtungen streiten könnte, da so wenig Informationen gegeben werden. Aber ich war sehr unzufrieden mit der Antwort meines Professors.
Paul
4
@Paul, es ist eigentlich ziemlich schwer, gute statistische Fragen zu schreiben. Ich weiß, ich habe es oft geschwänzt.
gung - Reinstate Monica
1
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.- Ich denke, Sie sollten die Annahme explizit machen, dass Prüfungsfragen unabhängig vom Pool möglicher Fragen gezogen werden. Eine Korrelation wäre realistischer: Wenn Frage 1 einfach ist, erhalten Sie wahrscheinlich eine einfache Prüfung, und Frage 2 ist einfach.
Adrian
0

Wenn es n Fragen gibt und ich mit der Wahrscheinlichkeit p eine Frage richtig beantworten kann und genügend Zeit für die Beantwortung aller Fragen vorhanden ist und ich 100 dieser Tests durchgeführt habe, sind meine Ergebnisse normalverteilt mit einem Mittelwert von np.

Aber ich wiederhole den Test nicht 100 Mal. Es sind 100 verschiedene Kandidaten, die einen Test mit jeweils eigener Wahrscheinlichkeit durchführen. P. Die Verteilung dieser ps wird der übergeordnete Faktor sein. Sie könnten einen Test haben, bei dem p = 0,9, wenn Sie das Thema gut studiert haben, p = 0,1, wenn Sie dies nicht getan haben, mit sehr wenigen Personen zwischen 0,1 und 0,9. Die Punkteverteilung weist bei 0,1n und 0,9n sehr starke Maxima auf und ist bei weitem nicht normalverteilt.

Auf der anderen Seite gibt es Tests, bei denen jeder jede Frage beantworten kann, aber unterschiedliche Zeit benötigt, sodass einige alle n Fragen beantworten und andere weniger, weil ihnen die Zeit ausgeht. Wenn wir davon ausgehen können, dass die Geschwindigkeit der Kandidaten normalverteilt ist, sind die Punkte nahezu normalverteilt.

Viele Tests werden jedoch einige sehr schwierige und einige sehr einfache Fragen enthalten, damit wir zwischen den besten Kandidaten (die alle Fragen bis zu einem gewissen Grad beantworten) und den schlechtesten Kandidaten (die nur sehr schwer antworten können) unterscheiden können einfache Fragen). Dies würde die Punkteverteilung sehr stark verändern.

gnasher729
quelle
2
Die hier beschriebene Normalverteilung ist eine normale Approximation des Binoms. Offensichtlich wäre die Summe von Nullen und Einsen nicht stetig und würde zwischen und-
Tim
2
@Tim Trotz des unnötigen Vertrauens auf Normalverteilungen und des Geheimnisses, 100 Tests durchzuführen, hat diese Antwort den Versuch verdient, zu demonstrieren, wie ein bestimmter Fall zu einer offensichtlich nicht-binomialen Verteilung führen kann. Insofern könnte es einen wertvollen Beitrag zur Beantwortung dieser technischen Fragen leisten.
Whuber
0

Per Definition ist eine Binomialverteilung eine Menge von unabhängigen und identisch verteilten Bernoulli-Versuchen. Bei einer Multiple-Choice-Prüfung wäre jede der Fragen eine der Bernoulli-Prüfungen.nn n

Das Problem tritt hier auf, weil wir nicht davon ausgehen können, dass die Fragen:n

  • Sind identisch verteilt . Wie Sie sagten, entspricht die Wahrscheinlichkeit, dass ein Schüler die Antwort auf Frage kennt, mit ziemlicher Sicherheit nicht der Wahrscheinlichkeit, dass er die Antwort auf Frage kennt , und so weiter.212
  • Sind unabhängig . Viele Prüfungen stellen Fragen, die auf den Antworten auf die vorherigen Fragen aufbauen. Wer kann mit Sicherheit sagen, dass dies bei der Prüfung in dieser Frage nicht der Fall ist? Es gibt andere Faktoren, die Antworten auf Prüfungsfragen geben könnten, die nicht unabhängig voneinander sind, aber ich denke, dass dies die intuitivste ist.

Ich habe Fragen in Statistikklassen gesehen, die Prüfungsfragen als Binomialzahlen modellieren, aber sie sind in etwa wie folgt umrahmt:

Welche Wahrscheinlichkeitsverteilung würde die Anzahl der Fragen modellieren, die bei einer Multiple-Choice-Prüfung richtig beantwortet wurden, bei der jede Frage vier Auswahlmöglichkeiten hat und der Prüfling jede Antwort nach dem Zufallsprinzip errät?

In diesem Szenario würde es natürlich als Binomialverteilung mit .p=14

jjw
quelle
Mit Ihren Fakten ist nichts los, aber die Logik ist falsch: Es reicht nicht aus, zu demonstrieren, dass einige Annahmen möglicherweise nicht zutreffen, da die Verteilung (logischerweise) auf jeden Fall immer noch binomisch sein kann. Sie müssen auch nachweisen, dass diese Annahmen auf eine Weise scheitern können, bei der die Punkteverteilung definitiv nicht binomisch ist.
Whuber