Gibt es eine einfache Äquivalenztestversion des Kolmogorov-Smirnov-Tests?

13

Hat zwei einseitige Tests für Äquivalenz (TOST) wurde für die Kolmogorov-Smirnov - Test eingerahmt die negativist Null - Hypothese zu testen , dass zwei Verteilungen unterscheiden sich durch zumindest einige Forscher festgelegten Ebene?

Wenn nicht TOST, dann eine andere Form der Äquivalenzprüfung?

Nick Stauner weist weise darauf hin, dass (ich sollte es bereits wissen;) es andere nichtparametrische TOST-Äquivalenztests für Nullhypothesen für stochastische Äquivalenz und mit restriktiveren Annahmen für mittlere Äquivalenz gibt.

Alexis
quelle

Antworten:

9

Ok, hier ist mein erster Versuch. Genaue Prüfung und Kommentare erwünscht!

Die Zwei-Stichproben-Hypothesen
Wenn wir einseitige Kolmogorov-Smirnov-Hypothesentests mit zwei Stichproben durchführen können , mit Null- und Alternativhypothesen in dieser Richtung:

H 0F Y ( t )F X ( t ) und0FY(t)FX(t)

H AF Y ( t ) < F X ( t ) , für mindestens eine t , wobei gilt:AFY(t)<FX(t)t

  • D - = | min t ( F Y ( t ) - F X ( t ) ) | 0F Y ( t )F X ( t )D=|mint(FY(t)FX(t))|0FY(t)FX(t)

  • die Teststatistik entspricht H ; undD + = | max t ( F Y ( t ) - F X ( t ) ) | 0F Y ( t )F X ( t )D+=|maxt(FY(t)FX(t))|0FY(t)FX(t)

  • F Y ( t )FY(t) & sind die empirischen CDFs der Stichproben und ,F X ( t )FX(t)Y YXX

dann sollte es sinnvoll sein, eine allgemeine Intervallhypothese für einen Äquivalenztest nach diesen Grundsätzen zu erstellen (unter der Annahme, dass das Äquivalenzintervall momentan symmetrisch ist):

H und- 0| FY(t)-FX(t)| Δ0|FY(t)FX(t)|Δ

H , für mindestens eine .- A| FY(t)-FX(t)| <ΔA|FY(t)FX(t)|<Δtt

Dies würde zu den spezifischen zwei einseitigen "negativistischen" Nullhypothesen führen, um die Äquivalenz zu prüfen (diese beiden Hypothesen haben dieselbe Form, da sowohl als auch absolut nicht negativ sind):D +D+ D -D

H oder- 01D+Δ01D+Δ

H .- 02D-Δ02DΔ

Ablehnen beide H und H würde man führen , dass zu dem Schluss . Natürlich muss das Äquivalenzintervall nicht symmetrisch sein, und und könnten für die jeweiligen einseitigen Nullhypothesen durch (unten) und (oben) ersetzt werden.- 0101 0202Δ<FY(t)FX(t)<ΔΔ<FY(t)FX(t)<ΔΔΔΔΔΔ2Δ2Δ1Δ1

Die Teststatistik (Aktualisiert: Delta liegt außerhalb des Absolutwertzeichens)
Die Teststatistik und (wobei und implizit bleiben) entsprechen H bzw. H und sind:D+1D+1D2D2nYnYnXnX01010202

D+1=ΔD+=Δ|maxt[(FY(t)FX(t))]|D+1=ΔD+=Δ|maxt[(FY(t)FX(t))]|, und

D2=ΔD=Δ|mint[(FY(t)FX(t))]|D2=ΔD=Δ|mint[(FY(t)FX(t))]|

Der Äquivalenz- / Relevanzschwellenwert
Das Intervall - oder , wenn ein asymmetrisches Äquivalenzintervall verwendet wird - wird in Einheiten von und ausgedrückt oder die Größe der differenzierten Wahrscheinlichkeiten. Als und Ansatz Unendlichkeit, der CDF von oder für nähert sich für und für t \ ge 0 :[Δ,Δ][Δ,Δ][Δ2,Δ1][Δ2,Δ1]D+D+DDnYnYnXnXD+D+DDnY,nXnY,nX00t<0t<0t0t0

limnY,nXp+=P(nYnXnY+nXD+t)=1e2t2

limnY,nXp+=P(nYnXnY+nXD+t)=1e2t2

CDF von $ D ^ {+} $ (oder $ D ^ {-} $)

So scheint es mir , dass das PDF für die Probengröße skaliert (oder Stichprobengröße skaliert ) muss für und für :D+D+DD00t<0t<0t0t0

f(t)=1e2t2ddt=4te2t2

f(t)=1e2t2ddt=4te2t2

PDF von $ D ^ {+} $ (oder $ D ^ {-} $)

Glen_b weist darauf hin, dass dies eine Rayleigh-Distribution mit . Die große Stichprobenquantilfunktion für und skalierter Stichprobengröße lautet also:σ=12σ=12D+D+DD

CDF1=Q(p)=ln(1p)2

CDF1=Q(p)=ln(1p)2

und eine liberale Wahl von könnte der kritische Wert , und eine strengere Wahl der kritische Wert .ΔΔQα+σ/2=Qα+14Qα+σ/2=Qα+14Qα+σ/4=Qα+18Qα+σ/4=Qα+18

Alexis
quelle
1
In der Zeile, in der Sie vom cdf zum pdf übergehen, denke ich, dass Sie das falsch verstanden haben. Sei , also (missbräuchlich) Notation), in der Grenze . Dann ist (beachte das nach der ). (Beachten Sie auch ein fehlendes Zeichen im Exponenten in der Zeile über der Ableitung. Ich bin mir auch nicht sicher, warum Sie dort ein integrales Symbol haben, aber vielleicht habe ich etwas falsch verstanden.)KnY,nX=nYnXnY+nXD+KnY,nX=nYnXnY+nXD+P(K,t)=1e2t2P(K,t)=1e2t2fK(t)=ddt1e2t2=4te2t2fK(t)=ddt1e2t2=4te2t2tt44
Glen_b -Reinstate Monica
2
@stochazesthai und sind zwei einseitige Teststatistiken. Pro TOST müssen Sie beide Nullhypothesen ablehnen, für die diese Teststatistiken gelten. ist ein kritischer Wert von CDF in der obigen Zeile, und wo Sie in für möchten (z. B. ). Die Wahl von hängt davon ab, wie weit (der kritische Ablehnungswert für einen einfachen alten Positivisten ) zurückliegt , bevor Sie einen relevanten Unterschied feststellen (z. B. liberale 'Äquivalenz' istD1D1D2D2QαQα111α1αppQα=ln(1(1α))2Qα=ln(1(1α))2ΔΔQαQαH0H01414 σσ jenseits von ). QαQα
Alexis
2
@stochazesthai (Fortsetzung) Wenn also sowohl als auch , dann lehnen Sie . D1ΔD1ΔD2ΔD2ΔH0H0
Alexis
2
@ stochazesthai Hoppla! Ich sollte die Anführungszeichen um das Wort gesetzt haben liberale und nicht Gleichwertigkeit zurück zwei Kommentare. :)
Alexis
2
@stochazesthai Wenn , dann lehne , wenn , dann lehne . Wenn , dann lehne , wenn , dann lehne . Wenn beide ablehnen und , weisen dann , sonst nicht verwerfen . D1ΔD1ΔH01H01D1<ΔH01D2ΔH02D2<ΔH02H01H02H0H0
Alexis
6

Eine Alternative zu TOST bei Äquivalenztests basiert auf dem Konfidenzintervallansatz:

Es sei die vorgegebene Äquivalenzspanne und der Kolmogorov-Smirnov-Abstand zwischen den unbekannten zugrunde liegenden Verteilungsfunktionen.Δ
θ:=supt|FX(t)FY(t)|

Wenn nun ein 90% -Konfidenzintervall für vollständig innerhalb von , können wir zu 95% sicher sein, dass nahe 0 ist, um von "Äquivalenz" zu sprechen.θ[Δ,Δ]θ

Ohne die zugrunde liegenden Verteilungen zu kennen, scheint es hoffnungslos, ein ungefähres analytisches Konfidenzintervall abzuleiten, so dass wir uns möglicherweise auf (vorurteilskorrigierte) Bootstrap-Konfidenzintervalle stützen müssen, die auf dem erneuten Abtasten von Paaren und basieren . (Ich möchte jedoch keine Bedingungen für ihre Gültigkeit in dieser speziellen Anwendung finden ...)XY

Michael M
quelle
Ausgezeichnet. Haben Sie ein Zitat für jemanden, der das CI von (Bootstrap oder anderweitig) durchführt? Dn1,n2
Alexis
1
Guter Punkt ... Die Kurzarbeit tomswebpage.net/images/K-S_test.doc erwähnt das "Handbuch für parametrische und nichtparametrische statistische Verfahren, fünfte Auflage von David J.Sheskin (27. April 2011)". Ich habe aber im Moment keinen Zugang zu diesem Buch.
Michael M