Hier ist eine einfache Statistikfrage, die mir gestellt wurde. Ich bin mir nicht sicher, ob ich das verstehe.
X = Anzahl der in einer Prüfung erworbenen Punkte (Multiple Choice und richtige Antwort sind ein Punkt). Ist X-Binomial verteilt?
Die Antwort des Professors war:
Ja, weil es nur richtige oder falsche Antworten gibt.
Meine Antwort:
Nein, denn jede Frage hat eine andere "Erfolgswahrscheinlichkeit" p. Wie ich verstanden habe, ist eine Binomialverteilung nur eine Reihe von Bernoulli-Experimenten, die jeweils ein einfaches Ergebnis (Erfolg oder Misserfolg) mit einer gegebenen Erfolgswahrscheinlichkeit p haben (und alle in Bezug auf p "identisch" sind). ZB 100 mal eine (faire) Münze werfen, das sind 100 Bernoulli-Experimente und alle haben p = 0,5. Aber hier haben die Fragen verschiedene Arten von p oder?
quelle
Antworten:
Ich würde Ihrer Antwort zustimmen. Normalerweise würde diese Art von Daten heutzutage mit einer Art Item Response Theory- Modell modelliert. Wenn Sie beispielsweise das Rasch-Modell verwenden , wird die binäre Antwort als modelliertXn ich
wo kann wie folgt beschrieben werden - ten Personen Fähigkeit und als - te Frage Schwierigkeit. Das Modell ermöglicht es Ihnen, die Tatsache zu erfassen, dass verschiedene Personen in ihren Fähigkeiten und Fragen in ihrem Schwierigkeitsgrad variieren. Dies ist das einfachste der IRT-Modelle.βn n δich ich
Die Antwort Ihrer Professoren geht davon aus, dass alle Fragen dieselbe Wahrscheinlichkeit für "Erfolg" haben und unabhängig sind, da das Binom eine Verteilung einer Summe von iid Bernoulli-Versuchen ist. Die beiden oben beschriebenen Arten von Abhängigkeiten werden ignoriert.n
Wie in den Kommentaren bemerkt, wenn Sie sich die Verteilung der Antworten einer bestimmten Person ansehen (damit Sie sich nicht um die Variabilität zwischen Personen kümmern müssen), oder die Antworten verschiedener Personen auf dasselbe Element (damit es keine Zwischenfälle gibt). Itemvariabilität), dann wäre die Verteilung Poisson-binomial, dh die Verteilung der Summe von nicht-iid Bernoulli-Versuchen. Die Verteilung könnte mit binomial oder Poisson angenähert werden , aber das ist alles. Ansonsten machen Sie die iid-Annahme.n
Selbst unter der Annahme "null", dass es keine Vermutungsmuster gibt, wird davon ausgegangen, dass es keine Vermutungsmuster gibt. Die Menschen unterscheiden sich also nicht darin, wie sie raten, und die Gegenstände unterscheiden sich nicht darin, wie sie raten. Die Vermutung ist also rein zufällig.
quelle
Die Antwort auf dieses Problem hängt von der Festlegung der Frage und dem Zeitpunkt ab, zu dem Informationen eingeholt werden. Insgesamt stimme ich dem Professor in der Regel zu, denke aber, dass die Erklärung seiner / ihrer Antwort schlecht ist und die Frage des Professors im Vorfeld mehr Informationen enthalten sollte.
Wenn Sie eine unendliche Anzahl möglicher Prüfungsfragen in Betracht ziehen und eine zufällig für Frage 1 zeichnen, zeichnen Sie eine zufällig für Frage 2 usw. Gehen Sie dann zur Prüfung:
In diesem Rahmen werden die Annahmen eines Binomialversuchs erfüllt.
Leider sind schlecht vorgeschlagene statistische Probleme in der Praxis sehr verbreitet, nicht nur bei Prüfungen. Ich würde nicht zögern, Ihre Begründung gegenüber Ihrem Professor zu verteidigen.
quelle
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.
- Ich denke, Sie sollten die Annahme explizit machen, dass Prüfungsfragen unabhängig vom Pool möglicher Fragen gezogen werden. Eine Korrelation wäre realistischer: Wenn Frage 1 einfach ist, erhalten Sie wahrscheinlich eine einfache Prüfung, und Frage 2 ist einfach.Wenn es n Fragen gibt und ich mit der Wahrscheinlichkeit p eine Frage richtig beantworten kann und genügend Zeit für die Beantwortung aller Fragen vorhanden ist und ich 100 dieser Tests durchgeführt habe, sind meine Ergebnisse normalverteilt mit einem Mittelwert von np.
Aber ich wiederhole den Test nicht 100 Mal. Es sind 100 verschiedene Kandidaten, die einen Test mit jeweils eigener Wahrscheinlichkeit durchführen. P. Die Verteilung dieser ps wird der übergeordnete Faktor sein. Sie könnten einen Test haben, bei dem p = 0,9, wenn Sie das Thema gut studiert haben, p = 0,1, wenn Sie dies nicht getan haben, mit sehr wenigen Personen zwischen 0,1 und 0,9. Die Punkteverteilung weist bei 0,1n und 0,9n sehr starke Maxima auf und ist bei weitem nicht normalverteilt.
Auf der anderen Seite gibt es Tests, bei denen jeder jede Frage beantworten kann, aber unterschiedliche Zeit benötigt, sodass einige alle n Fragen beantworten und andere weniger, weil ihnen die Zeit ausgeht. Wenn wir davon ausgehen können, dass die Geschwindigkeit der Kandidaten normalverteilt ist, sind die Punkte nahezu normalverteilt.
Viele Tests werden jedoch einige sehr schwierige und einige sehr einfache Fragen enthalten, damit wir zwischen den besten Kandidaten (die alle Fragen bis zu einem gewissen Grad beantworten) und den schlechtesten Kandidaten (die nur sehr schwer antworten können) unterscheiden können einfache Fragen). Dies würde die Punkteverteilung sehr stark verändern.
quelle
Per Definition ist eine Binomialverteilung eine Menge von unabhängigen und identisch verteilten Bernoulli-Versuchen. Bei einer Multiple-Choice-Prüfung wäre jede der Fragen eine der Bernoulli-Prüfungen.nn n
Das Problem tritt hier auf, weil wir nicht davon ausgehen können, dass die Fragen:n
Ich habe Fragen in Statistikklassen gesehen, die Prüfungsfragen als Binomialzahlen modellieren, aber sie sind in etwa wie folgt umrahmt:
In diesem Szenario würde es natürlich als Binomialverteilung mit .p = 14
quelle