Ich habe einige Schwierigkeiten, die Interpretation des 2-Stichproben-KS-Tests zu verstehen und festzustellen, wie sich dieser von einem regulären t-Test zwischen 2 Gruppen unterscheidet.
Nehmen wir an, ich habe Männer und Frauen, die eine Aufgabe erledigen, und ich sammle einige Punkte von dieser Aufgabe. Mein letztendliches Ziel ist es festzustellen, ob Männer und Frauen bei dieser Aufgabe unterschiedliche Leistungen erbringen
Ich könnte also einen Test zwischen den beiden Gruppen absolvieren. Eine andere Sache, die ich tun könnte, ist, das ECDF für Männer und Frauen zu berechnen, sie aufzuzeichnen und den KS-Test mit 2 Stichproben durchzuführen. Ich würde so etwas bekommen:
KS-Test
Die Nullhypothese für den KS-Test lautet, dass die 2 Sätze kontinuierlicher Punkteverteilungen aus derselben Grundgesamtheit stammen
Bei der Durchführung des KS-Tests erhalte ich: D = 0,18888, p-Wert = 0,04742
Zunächst möchte ich überprüfen, ob meine Interpretation der Ergebnisse korrekt ist. Hier würde ich die Nullhypothese ablehnen und sagen, dass männliche und weibliche Punkteverteilungen aus unterschiedlichen Populationen stammen. Mit anderen Worten, die Verteilung der männlichen und weiblichen Bewertungen unterscheidet sich voneinander.
Insbesondere neigen Männer dazu, eine höhere Wahrscheinlichkeit zu haben, bei dieser Aufgabe niedrigere Punktzahlen zu erzielen, und das ist der Unterschied zwischen den beiden Geschlechtern, wie ich aus der Handlung interpretiere
T-Test
Jetzt wird beim Test der Unterschied zwischen männlichen und weiblichen Mitteln auf der Bewertungsvariablen getestet.
Stellen wir uns den Fall vor, in dem männliche Leistungen bei dieser Aufgabe schlechter sind als weibliche. In diesem Fall konzentriert sich die Verteilung der männlichen Punkte auf einen niedrigen Mittelwert, während sich die Verteilung der weiblichen Punkte auf einen hohen Mittelwert konzentriert. Dieses Szenario würde der obigen Darstellung entsprechen, da Männer mit höherer Wahrscheinlichkeit niedrigere Punktzahlen erzielen
Wenn der t-Test signifikant ausfällt, würde ich den Schluss ziehen, dass Frauen im Durchschnitt signifikant mehr Punkte erzielen als Männer. In Bezug auf die Bevölkerung werden die Punktzahlen der Frauen aus einer Bevölkerung gezogen, deren Mittelwert höher ist als der der Männer, was der Schlussfolgerung der KS, dass sie aus verschiedenen Bevölkerungsgruppen stammen, sehr ähnlich klingt.
Was ist der Unterschied?
Die Schlussfolgerung, die ich in den KS- und t-Testfällen ziehen würde, ist also die gleiche. Männer schneiden im Vergleich zu Frauen schlecht ab. Was bringt es also, wenn ein Test dem anderen vorgezogen wird? Gibt es neue Erkenntnisse, die Sie mit dem KS-Test gewinnen können?
Die Art und Weise, wie ich es sehe, Männer mit einer Verteilung um einen niedrigen Mittelwert und Frauen um einen hohen Mittelwert, ist der Grund für den signifikanten t-Test. Aufgrund der gleichen Tatsache haben Männer eine höhere Wahrscheinlichkeit, niedrigere Werte zu erzielen, was dazu führen würde, dass der Plot wie oben aussieht und einen signifikanten KS-Test ergibt. Die Ergebnisse beider Tests haben also die gleiche Ursache, aber vielleicht könnte man argumentieren, dass ein KS-Test mehr als nur die Mittelwerte der Verteilungen berücksichtigt und auch die Form der Verteilung berücksichtigt, aber es ist möglich, die Ursache herauszusuchen des signifikanten KS-Tests nur aus den Testergebnissen?
Welchen Wert hat es also, einen KS-Test bei Test zu wiederholen? Und lassen Sie uns annehmen, dass ich die Annahmen des t-Tests für diese Frage erfüllen kann
Antworten:
Als Beispiel, warum Sie den Kolmogorov-Smirnov-Test mit zwei Stichproben verwenden möchten:
Stellen Sie sich vor, dass die Populationsmittelwerte ähnlich, die Abweichungen jedoch sehr unterschiedlich waren. Der Kolmogorov-Smirnov-Test könnte diesen Unterschied ausgleichen, der t-Test jedoch nicht.
Oder stellen Sie sich vor, die Verteilungen haben ähnliche Mittel und SDs, aber die Männchen haben eine bimodale Verteilung (rot), während die Weibchen (blau) dies nicht tun:
Verhalten sich Männchen und Weibchen unterschiedlich? Ja - die Männchen tendieren dazu, entweder zwischen 7,5 und 8 oder zwischen 12,5 und 13 zu punkten, während die Weibchen tendenziell häufiger zur Mitte hin punkten (nahe 10 oder so), sind aber um diesen Wert weniger gruppiert als die beiden Werte Männer neigen dazu, in der Nähe von zu punkten.
Der Kolmogorov-Smirnov kann also viel allgemeinere Unterschiede in der Verteilung feststellen als der T-Test.
quelle