Hat zwei einseitige Tests für Äquivalenz (TOST) wurde für die Kolmogorov-Smirnov - Test eingerahmt die negativist Null - Hypothese zu testen , dass zwei Verteilungen unterscheiden sich durch zumindest einige Forscher festgelegten Ebene?
Wenn nicht TOST, dann eine andere Form der Äquivalenzprüfung?
Nick Stauner weist weise darauf hin, dass (ich sollte es bereits wissen;) es andere nichtparametrische TOST-Äquivalenztests für Nullhypothesen für stochastische Äquivalenz und mit restriktiveren Annahmen für mittlere Äquivalenz gibt.
kolmogorov-smirnov
equivalence
tost
Alexis
quelle
quelle
Antworten:
Ok, hier ist mein erster Versuch. Genaue Prüfung und Kommentare erwünscht!
Die Zwei-Stichproben-Hypothesen
Wenn wir einseitige Kolmogorov-Smirnov-Hypothesentests mit zwei Stichproben durchführen können , mit Null- und Alternativhypothesen in dieser Richtung:
H 0 : F Y ( t ) ≥ F X ( t ) und0: FY(t)≥FX(t)
H A : F Y ( t ) < F X ( t ) , für mindestens eine t , wobei gilt:A: FY(t)<FX(t) t
D - = | min t ( F Y ( t ) - F X ( t ) ) | 0 : F Y ( t ) ≥ F X ( t )D−=|mint(FY(t)−FX(t))| 0: FY(t)≥FX(t)
die Teststatistik entspricht H ; undD + = | max t ( F Y ( t ) - F X ( t ) ) | 0 : F Y ( t ) ≤ F X ( t )D+=|maxt(FY(t)−FX(t))| 0: FY(t)≤FX(t)
F Y ( t )FY(t) & sind die empirischen CDFs der Stichproben und ,F X ( t )FX(t) Y Y XX
dann sollte es sinnvoll sein, eine allgemeine Intervallhypothese für einen Äquivalenztest nach diesen Grundsätzen zu erstellen (unter der Annahme, dass das Äquivalenzintervall momentan symmetrisch ist):
H und- 0 : | FY(t)-FX(t)| ≥Δ−0: |FY(t)−FX(t)|≥Δ
H , für mindestens eine .- A : | FY(t)-FX(t)| <Δ−A: |FY(t)−FX(t)|<Δ tt
Dies würde zu den spezifischen zwei einseitigen "negativistischen" Nullhypothesen führen, um die Äquivalenz zu prüfen (diese beiden Hypothesen haben dieselbe Form, da sowohl als auch absolut nicht negativ sind):D +D+ D -D−
H oder- 01 : D+≥Δ−01: D+≥Δ
H .- 02 : D-≥Δ−02: D−≥Δ
Ablehnen beide H und H würde man führen , dass zu dem Schluss . Natürlich muss das Äquivalenzintervall nicht symmetrisch sein, und und könnten für die jeweiligen einseitigen Nullhypothesen durch (unten) und (oben) ersetzt werden.- 01−01 −02−02 −Δ<FY(t)−FX(t)<Δ−Δ<FY(t)−FX(t)<Δ −Δ−Δ ΔΔ Δ2Δ2 Δ1Δ1
Die Teststatistik (Aktualisiert: Delta liegt außerhalb des Absolutwertzeichens)D+1 D−2D−2 nYnY nXnX −01−01 −02−02
Die Teststatistik und (wobei und implizit bleiben) entsprechen H bzw. H und sind:D+1
D+1=Δ−D+=Δ−|maxt[(FY(t)−FX(t))]|D+1=Δ−D+=Δ−|maxt[(FY(t)−FX(t))]| , und
D−2=Δ−D−=Δ−|mint[(FY(t)−FX(t))]|D−2=Δ−D−=Δ−|mint[(FY(t)−FX(t))]|
Der Äquivalenz- / Relevanzschwellenwert[−Δ,Δ] [Δ2,Δ1][Δ2,Δ1] D+D+ D−D− nYnY nXnX D+D+ D−D− nY,nXnY,nX 00 t<0t<0 t≥0t≥0
Das Intervall - oder , wenn ein asymmetrisches Äquivalenzintervall verwendet wird - wird in Einheiten von und ausgedrückt oder die Größe der differenzierten Wahrscheinlichkeiten. Als und Ansatz Unendlichkeit, der CDF von oder für nähert sich für und für t \ ge 0 :[−Δ,Δ]
limnY,nX→∞p+=P(√nYnXnY+nXD+≤t)=1−e−2t2
So scheint es mir , dass das PDF für die Probengröße skaliert (oder Stichprobengröße skaliert ) muss für und für :D+D+ D−D− 00 t<0t<0 t≥0t≥0
f(t)=1−e−2t2ddt=4te−2t2
Glen_b weist darauf hin, dass dies eine Rayleigh-Distribution mit . Die große Stichprobenquantilfunktion für und skalierter Stichprobengröße lautet also:σ=12σ=12 D+D+ D−D−
CDF−1=Q(p)=√−ln(1−p)2
und eine liberale Wahl von könnte der kritische Wert , und eine strengere Wahl der kritische Wert .ΔΔ Qα+σ/2=Qα+14Qα+σ/2=Qα+14 Qα+σ/4=Qα+18Qα+σ/4=Qα+18
quelle
Eine Alternative zu TOST bei Äquivalenztests basiert auf dem Konfidenzintervallansatz:
Es sei die vorgegebene Äquivalenzspanne und der Kolmogorov-Smirnov-Abstand zwischen den unbekannten zugrunde liegenden Verteilungsfunktionen.Δ
θ:=supt|FX(t)−FY(t)|
Wenn nun ein 90% -Konfidenzintervall für vollständig innerhalb von , können wir zu 95% sicher sein, dass nahe 0 ist, um von "Äquivalenz" zu sprechen.θ[−Δ,Δ]θ
Ohne die zugrunde liegenden Verteilungen zu kennen, scheint es hoffnungslos, ein ungefähres analytisches Konfidenzintervall abzuleiten, so dass wir uns möglicherweise auf (vorurteilskorrigierte) Bootstrap-Konfidenzintervalle stützen müssen, die auf dem erneuten Abtasten von Paaren und basieren . (Ich möchte jedoch keine Bedingungen für ihre Gültigkeit in dieser speziellen Anwendung finden ...)XY
quelle