Ich möchte die Verwendung der Monte-Carlo-Simulation in der chisq.test()
Funktion in R verstehen .
Ich habe eine qualitative Variable mit 128 Stufen / Klassen. Meine Stichprobengröße beträgt 26 (ich konnte nicht mehr "Einzelpersonen" befragen). Also werde ich natürlich einige Level mit 0 "Individuen" haben. Tatsache ist jedoch, dass ich nur eine sehr kleine Anzahl von Klassen von 127 möglichen vertreten habe. Da ich gehört habe, dass wir für die Anwendung des Chi-Quadrat-Tests mindestens 5 Personen in jeder Ebene haben sollten (ich verstehe den Grund dafür nicht vollständig), dachte ich, ich müsste die simulate.p.value
Option verwenden, um die Monte-Carlo-Simulation zur Schätzung der Verteilung zu verwenden und berechne einen p-Wert. Ohne Monte-Carlo-Simulation gibt R einen p-Wert < 1e-16
. Mit der Monte-Carlo-Simulation erhält ich einen p-Wert bei 4e-5
.
Ich habe versucht, den p-Wert mit einem Vektor von 26 Einsen und 101 Nullen zu berechnen, und mit der Monte-Carlo-Simulation erhalte ich einen p-Wert bei 1.
Ist es in Ordnung zu behaupten, dass selbst wenn meine Stichprobengröße im Vergleich zur Anzahl möglicher Klassen klein ist, die beobachtete Verteilung so ist, dass es sehr unwahrscheinlich ist, dass alle möglichen Klassen mit der gleichen Wahrscheinlichkeit (1/127) in der realen Bevölkerung existieren ?
quelle
Antworten:
Bei der Suche scheint es der Sinn der Monte-Carlo-Simulation zu sein, eine Referenzverteilung auf der Grundlage zufällig generierter Proben zu erstellen, die dieselbe Größe wie die getestete Probe haben, um p-Werte zu berechnen, wenn die Testbedingungen nicht erfüllt sind.
Dies wird in der Serie B (1968) von Hope A. J Royal Stat Society erklärt, die auf JSTOR zu finden ist .
Hier ist ein relevantes Zitat aus dem Hope-Papier:
quelle