Ich versuche zu verstehen, wie man Werte für den einseitigen Kolmogorov-Smirnov-Test erhält , und habe Schwierigkeiten, CDFs für und im Fall mit zwei Stichproben. Das Folgende wird an einigen Stellen als CDF für in einem Fall mit einer Stichprobe zitiert :D + n 1 , n 2 D - n 1 , n 2 D + n
Außerdem gibt es eine etwas andere Formulierung dieser CDF mit einer Stichprobe (ich ersetze t in seinem Zitat durch für um die Übereinstimmung mit meiner Notation hier zu gewährleisten ):
Unter Verwendung der Wahrscheinlichkeitsintegraltransformation leitet Donald Knuth ihre (gemeinsame) Verteilung auf p ab. 57 und Übung 17 von TAoCP Band 2. Ich zitiere:
Dies würde für einseitige Hypothesen im Fall einer Stichprobe gelten, wie zum Beispiel: H , wobei die empirische CDF ist von und ist eine CDF.
Ich denke, das in diesem Fall der Wert von in der Stichprobe, und dass die größte ganze Zahl in . (Ist das richtig?)
Aber was ist die CDF für (oder ), wenn man zwei Samples hat? Zum Beispiel, wenn H für die empirischen CDFs von und ? Wie erhalte ich ?
quelle
Antworten:
Ok, ich werde es versuchen. Kritische Erkenntnisse sind willkommen.
Auf Seite 192 beginnen Gibbons und Chakraborti (1992) unter Berufung auf Hodges, 1958, mit einer kleinen (genauen?) CDF für den zweiseitigen Test (ich tausche ihre und Notation gegen bzw. ):m,n d n1,n2 x
Wobei durch eine Aufzählung von Pfaden (die in und monoton ansteigen ) vom Ursprung zum Punkt durch einen Graphen mit - Ersetzen von durch - sind die Werte der x- Achse und der y- Achse und . Die Pfade müssen außerdem der Einschränkung entsprechen, innerhalb der Grenzen zu bleiben (wobei der Wert der Kolmogorov-Smirnov-Teststatistik ist):A(n1,n2) n1 n2 (n1,n2) Sm(x) Fn1(x) n1F1(x) n2F2(x) x
Unten sehen Sie das Bild Abbildung 3.2 mit einem Beispiel für mit 12 solchen Pfaden:A(3,4)
Gibbons und Chakaborti sagen weiter, dass der einseitige Wert mit derselben grafischen Methode erhalten wird, jedoch nur mit der Untergrenze für und nur das obere für .p D+n1,n2 D−n1,n2
Diese Ansätze mit kleinen Stichproben beinhalten Algorithmen zur Pfadaufzählung und / oder Wiederholungsrelationen, die zweifellos asymptotische Berechnungen wünschenswert machen. Gibbons und Chakraborti bemerken auch die begrenzenden CDFs, wenn sich und Unendlichkeit von nähern :n1 n2 Dn1,n2
Und sie geben die begrenzende CDF von (oder ) als:D+n1,n2 D−n1,n2
Da und streng nicht negativ sind, kann die CDF nur Werte ungleich Null über annehmen :D+ D− [0,∞)
Literaturhinweise
Gibbons, JD und Chakraborti, S. (1992). Nichtparametrische statistische Inferenz . Marcel Decker, Inc., 3. Auflage, überarbeitete und erweiterte Auflage.
Hodges, JL (1958). Die Signifikanzwahrscheinlichkeit des Smirnov-Zwei-Stichproben-Tests. Arkiv för matematik . 3 (5): 469–486.
quelle