Zwei-Stichproben-Permutation Kolmogorov-Smirnov-Tests

8

Während es einfacher ist, den Pearson-Chi-Quadrat / Cressie-Read-Typentest zu verwenden, möchte ich die Gleichheit der Proportionen in k Kategorien über zwei Gruppen unter Verwendung eines Kolmogorov-Smirnov-Typentests der von Pettitt & Stephens (1977 vorgeschlagenen Form) testen ) (siehe auch hier ).

Dn=supπsup1jk|i=1j(fexp,π(i)fobs,π(i))|
πf.,ii
Dn=12i=1k|fexp,ifobs,i|
Dn(r)=12i=1k|fgroup1,i(r)fgroup2,i(r)|,r=1,,R
wobei .(r) eine Statistik bezeichnet, die basierend auf der Permutation r ^ {\ text {th}} berechnet wird rthder kategorialen Variablen. Ablehnen, wenn der Wert der ursprünglichen Statistik größer als der Wert von 95% der permutierten Statistik ist.

Kommentare zu den Vor- und Nachteilen / der Gültigkeit eines solchen Verfahrens sind sehr willkommen. Vielen Dank.

Blaubeere
quelle

Antworten:

3

Die Antwort hängt von der Art des Datengenerierungsprozesses und von der alternativen Hypothese ab, die Sie im Sinn haben.

Ihr Test ist eine Art ungewichtetes Chi-Quadrat. Aufgrund dieser fehlenden Gewichtung sind Änderungen, die sich hauptsächlich auf die weniger bevölkerten Kategorien auswirken, schwer zu erkennen. Zum Beispiel wird Ihr Test viel weniger leistungsfähig sein als der Chi-Quadrat-Test für eine gleichmäßige Ortsverschiebung, der hauptsächlich dadurch erkannt wird, dass festgestellt wird, dass fast die gesamte Wahrscheinlichkeit in einem Schwanz in den anderen Schwanz verschoben wird.

Angenommen, Ihre Kategorien sind ganzzahlige Bereiche die durch indiziert sind, und Sie beobachten normale Variationen der Einheitsvarianz, aber einen unbekannten Mittelwert. Beispielsweise werden 100 Beobachtungen einer normalen Standardvariablen hauptsächlich die Kategorien bis belegen , obwohl Sie davon ausgehen können, dass einige die Kategorien und belegen . Selbst für eine satte große Verschiebung von Standardfehlern ( dh eine Änderung des Mittelwerts von ) beträgt die Leistung Ihres KD-ähnlichen Tests nur etwa 50% (wenn ).[i,i+1)i213255/100=0.5α=0.05

Es ist schwierig, sich eine Einstellung vorzustellen, in der dieser Test leistungsfähiger ist als der Chi-Quadrat-Test. Wenn Sie glauben, dass Sie sich in einer solchen Situation befinden, führen Sie einige Simulationen durch, um herauszufinden, wie hoch die Leistung ist und wie sie mit den alternativen Standardtests verglichen wird.

whuber
quelle
Wenn ich richtig verstehe, was du geschrieben hast, wäre nicht für alle ? auch - ich kann sehen, wie man einen Monte-Carlo-geschätzten kritischen Wert für erhält ; aber wie wäre es mit ? Dn(r)rDnDn(r)
Ronaf
@ronaf Könnten Sie mehr Details zu angeben ? Was ist R? Ich sehe nicht, dass das Permutieren der Kategorien überhaupt etwas bewirkt: Beachten Sie, dass keine Permutation die Summe der absoluten Unterschiede ihrer Anzahl ändert. Dn(r)
whuber