Ich habe eine Stichprobe von 250 Einheiten. Die Verteilung ist asymmetrisch. Ich möchte eine Hypothese testen, dass der Median der Bevölkerung von 3,5 abweicht, daher halte ich einen Test mit einer Stichprobe für angemessen. Ich weiß, dass der Wilcoxon-Rang-Test nicht angemessen ist, da die Verteilung nicht symmetrisch ist. Ist ein Zeichentest geeignet? Wenn dies nicht der Fall ist, kann jemand einen anderen Test empfehlen?
hypothesis-testing
median
LeonRupnik
quelle
quelle
Antworten:
Zusammenfassung
Die Anzahl der Daten über hat eine Binomialverteilung mit unbekannter Wahrscheinlichkeit . Verwenden Sie dies, um einen Binomialtest von gegen die Alternative durchzuführen .3.5 p p=1/2 p≠1/2
Der Rest dieses Beitrags erklärt das zugrunde liegende Modell und zeigt, wie die Berechnungen durchgeführt werden. Es bietet
R
Arbeitscode, um sie auszuführen. Eine ausführliche Darstellung der zugrunde liegenden Hypothesentesttheorie findet sich in meiner Antwort auf "Was bedeuten p-Werte und t-Werte in statistischen Tests?" .Das statistische Modell
Unter der Annahme, dass die Werte relativ unterschiedlich sind (mit wenigen Bindungen bei ), hat nach Ihrer Nullhypothese jeder zufällig ausgewählte Wert eine Chance von 1/2 , überschreiten (da als Mittelwert der Bevölkerung charakterisiert ist). . Unter der Annahme, dass alle Werte zufällig und unabhängig voneinander abgetastet wurden, hat die Anzahl von mehr als eine Binomialverteilung . Nennen wir diese Nummer "count", .3.5 1/2=50% 3.5 3.5 250 3.5 (250,1/2) k
Wenn sich der Populationsmedian von , unterscheidet sich die Wahrscheinlichkeit eines zufällig ausgewählten Werts von mehr als von . Dies ist die alternative Hypothese.3.5 3.5 1/2
Einen geeigneten Test finden
Der beste Weg, um die Nullsituation von ihren Alternativen zu unterscheiden, besteht darin, die Werte von , die am wahrscheinlichsten unter der Null und weniger wahrscheinlich unter den Alternativen liegen. Dies sind die Werte nahe von , gleich . Ein kritischer Bereich für Ihren Test besteht daher aus Werten, die relativ weit von : nahe oder nahek 1/2 250 125 125 0 250 125 3.5
Technisch gesehen gibt es zwei gebräuchliche Methoden, um die Berechnung durchzuführen: Berechnen Sie die Binomialwahrscheinlichkeiten oder approximieren Sie sie mit einer Normalverteilung.
Berechnung mit Binomialwahrscheinlichkeiten
Verwenden Sie die Prozentpunktfunktion (Quantil). Dies
R
wird beispielsweise aufgerufenqbinom
und wie folgt aufgerufenR
k
Berechnung mit normaler Näherung
R
Dieser Test ist nicht so leistungsfähig wie andere Tests, die bestimmte Annahmen über die Bevölkerung treffen , da er nichts über die Bevölkerung voraussetzt (außer dass die Wahrscheinlichkeit nicht direkt auf den Median ausgerichtet ist). Wenn der Test dennoch die Null ablehnt, besteht kein Grund zur Sorge über mangelnde Leistung. Andernfalls müssen Sie einige heikelen Kompromisse zwischen dem , was Sie bereit sind , zu übernehmen und was Sie sind in der Lage zu schließen , über die Bevölkerung.
quelle