Angenommen, ein Aufsichtspersonal vermutet, dass ein Schüler während einer Multiple-Choice-Prüfung Antworten von der Arbeit eines anderen Schülers kopiert. Sie überprüft später ihre Antworten und findet einige Ähnlichkeiten - aber andererseits gibt es aufgrund der Art der Prüfung zwangsläufig Ähnlichkeiten. Wie sollte sie feststellen, ob ihr Verdacht begründet war?
Mit anderen Worten, sie wird sicherlich die Prüfungen mit denen anderer Studenten vergleichen müssen (die, nehmen wir an, nicht betrogen haben). Aber wenn die Klassengröße sehr groß ist, ist es sinnvoll, eine zufällige Stichprobe zum Vergleich zu ziehen? Wie viele würde sie dann nehmen? Wenn es viele Fragen zur Prüfung gäbe, wäre es auch sinnvoll, eine Stichprobe der Fragen zum Vergleich zu ziehen? Macht es einen signifikanten Unterschied, ob jede Frage 2 mögliche Antworten (wahr / falsch) oder beispielsweise 4 hatte?
Ich habe keine spezifischen Zahlen, weil ich mich frage, wie das im Allgemeinen funktionieren würde. Ich habe einen Hintergrund in Mathematik, aber wenig Ausbildung in Statistik. Wie würden Sie diese Analyse statistisch beschreiben?
Vielen Dank.
quelle
Antworten:
Hier ist eine überraschend große Auswahl an Antwortkopie-Indizes, wobei ihre Vorzüge jedoch nur wenig diskutiert werden: http://www.bjournal.co.uk/paper/BJASS_01_01_06.pdf .
Es gibt ein Gebiet der (Bildungs-) Psychologie namens Item Response Theory (IRT), das den statistischen Hintergrund für Fragen wie diese liefert. Wenn Sie Amerikaner sind und einen SAT, ACT oder GRE absolviert haben, haben Sie sich mit einem Test befasst, der unter Berücksichtigung von IRT entwickelt wurde. Das Grundpostulat des IRT ist, dass jeder Schüler durch seine Fähigkeit charakterisiert ist ; Jede Frage ist durch ihre Schwierigkeit . und die Wahrscheinlichkeit, eine Frage richtig zu beantworten, ist wobei das cdf der Standardnormalen ist unda i b j π ( a i , b j ; c ) = P r o b [ Schüler i beantwortet Frage j richtig ] = Φ ( c ( a i - b j ) ) Φ ( z ) c c j iich einich bj
Bei "Ja / Nein" -Fragen kann dies das Ende der Geschichte sein. Bei mehr als zwei Kategoriefragen können wir zusätzlich davon ausgehen, dass alle falschen Entscheidungen gleich wahrscheinlich sind. für eine Frage mit Entscheidungen ist die Wahrscheinlichkeit jeder falschen Wahl .k j π ' ( a i , b j ; c ) = [ 1 - π ( a i , b j ; c ) ] / ( k j - 1 )j kj π′(ai,bj;c)=[1−π(ai,bj;c)]/(kj−1)
Für Studierende der Fähigkeiten und , die Wahrscheinlichkeit , dass sie für eine Frage mit Mühe auf ihre Antworten entsprechen ist Wenn Sie , können Sie dies in die Wahrscheinlichkeit der Übereinstimmung mit der richtigen Antwort und die Wahrscheinlichkeit der Übereinstimmung mit einer falschen Antwort, , obwohl diese Unterscheidung vom konzeptionellen Rahmen der IRT kaum wesentlich ist.ai ak bj
Jetzt können Sie die Wahrscheinlichkeit einer Übereinstimmung berechnen, aber sie wird wahrscheinlich kombinatorisch winzig sein. Ein besseres Maß kann das Verhältnis der Informationen im paarweisen Antwortmuster und beziehe es auf die Entropie Sie können dies für alle Schülerpaare tun, sie zeichnen oder ordnen und das größte Verhältnis von Information zu Entropie untersuchen.
Die Parameter des Tests und der Schülerfähigkeiten fallen nicht aus dem Himmel, können aber in moderner Software wie R mit leicht geschätzt werden oder ähnliche Pakete:{ a i }{c,bj,j=1,2,…} {ai}
lme4
oder etwas sehr nahes daran.
quelle