Stellen Sie fest, ob sich ein verteilter Prozess mit starkem Schwanz erheblich verbessert hat

12

Ich beobachte die Bearbeitungszeiten eines Prozesses vor und nach einer Änderung, um festzustellen, ob sich der Prozess durch die Änderung verbessert hat. Der Prozess hat sich verbessert, wenn die Bearbeitungszeit reduziert wird. Die Verteilung der Verarbeitungszeit ist fett begrenzt, daher ist ein Vergleich anhand des Durchschnitts nicht sinnvoll. Stattdessen möchte ich wissen, ob die Wahrscheinlichkeit, nach der Änderung eine geringere Verarbeitungszeit zu beobachten, deutlich über 50% liegt.

Sei die Zufallsvariable für die Verarbeitungszeit nach der Änderung und die vorige. Wenn signifikant über dann würde ich sagen, dass sich der Prozess verbessert hat. $X$ $Y$ $P(X < Y)$ $0.5$

Jetzt habe ich Beobachtungen von und Beobachtungen von . Die beobachtete Wahrscheinlichkeit von ist . $n$ $x_i$ $X$ $m$ $y_j$ $Y$ $P(X < Y)$ $\hat p = \frac{1}{n m} \sum_i \sum_j 1_{x_i < y_j}$

Was kann ich angesichts der Beobachtungen und über ? $P(X < Y)$ $x_i$ $y_j$

sampling nonparametric Christian
quelle

12

Ihre Schätzung entspricht der Mann-Whitney- Statistik geteilt durch (danke, Glen!) Und entspricht daher der Wilcoxon-Rang-Summen-Statistik (auch bekannt als Wilcoxon-Mann-Whitney-Statistik). : , wobei die Stichprobengröße von (unter der Annahme, dass keine Bindungen bestehen). Sie können daher Tabellen / Software des Wilcoxon-Tests verwenden und sie zurück in transformieren um ein Konfidenzintervall oder einen Wert zu erhalten. $\hat{p}$ $U$ $mn$ $W$ $W = U + {n(n+1)\over{2}}$ $n$ $y$ $U$ $p$

Sei die Stichprobengröße von , = . Dann, asymptotisch, $m$ $x$ $N$ $m+n$

$W^* = \frac{W-\frac{m(N+1)}{2}}{\sqrt{\frac{mn(N+1)}{12}}} \sim \text{N}(0,1)$

Quelle: Hollander und Wolfe , Nichtparametrische statistische Methoden, grob p. 117, aber wahrscheinlich bringen Sie die meisten nichtparametrischen Statistikbücher dorthin.

Bogenschütze
quelle

@ Glen_b - danke, ich habe die Antwort aktualisiert. Sehr großzügige Vermutung, dass Sie sich dort über die Ursache des Fehlers geäußert haben!

Jbowman

13

@jbowman bietet eine (nette) Standardlösung für das Problem der Schätzung von das als Spannungsstärkemodell bezeichnet wird . $\theta=P(X<Y)$

Eine weitere nichtparametrische Alternative wurde in Baklizi und Eidous (2006) für den Fall vorgeschlagen, dass und unabhängig sind. Dies wird weiter unten beschrieben. $X$ $Y$

Per Definition haben wir das

θ = P (X < Y) = \int_{- \infty}^{\infty} F_{X} (y) f_{Y} (y) d y,

$\theta=P(X<Y)=\int_{-\infty}^{\infty}F_X(y)f_Y(y)dy,$

wo ist der CDF von und ist die Dichte des . Dann wird unter Verwendung der Proben von und können wir erhalten Kernschätzern von und und folglich und Schätzer von $F_X$ $X$ $f_Y$ $Y$ $X$ $Y$ $F_X$ $f_Y$ $\theta$

\hat{θ} = \int_{- \infty}^{\infty} {\hat{F}}_{X} (y) {\hat{f}}_{Y} (y) d y .

$\hat\theta=\int_{-\infty}^{\infty}\hat F_X(y)\hat f_Y(y)dy.$

Dies wird im folgenden R-Code unter Verwendung eines Gaußschen Kernels implementiert.

# Optimal bandwidth
h = function(x){
n = length(x)
return((4*sqrt(var(x))^5/(3*n))^(1/5))
}

# Kernel estimators of the density and the distribution
kg = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(dnorm((x[i]-data)/hb))/hb
return(r )
} 

KG = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(pnorm((x[i]-data)/hb))
return(r )
} 

# Baklizi and Eidous (2006) estimator
nonpest = function(dat1B,dat2B){
return( as.numeric(integrate(function(x) KG(x,dat1B)*kg(x,dat2B),-Inf,Inf)$value))  
}

# Example when X and Y are Cauchy
datx = rcauchy(100,0,1)
daty =  rcauchy(100,0,1)

nonpest(datx,daty)

Um ein Konfidenzintervall für , können Sie ein Bootstrap- Beispiel dieses Schätzers wie folgt erhalten. $\theta$

# bootstrap
B=1000
p = rep(0,B)

for(j in 1:B){
dat1 =  sample(datx,length(datx),replace=T)
dat2 =  sample(daty,length(daty),replace=T)
p[j] = nonpest(dat1,dat2)
}

# histogram of the bootstrap sample
hist(p)

# A confidence interval (quantile type)
c(quantile(p,0.025),quantile(p,0.975))

Andere Arten von Bootstrap-Intervallen könnten ebenfalls in Betracht gezogen werden.

quelle

2

Interessant und eine gute Papierreferenz (+1). Ich werde es meinem Repertoire hinzufügen!

Jbowman

0

Betrachten Sie den paarigen Unterschied , dann für sind iid Bernoulli - Zufallsvariablen. So ist die Zahl von ist binomische . Dann ist eine unvoreingenommene Schätzung der Wahrscheinlichkeits- und Konfidenzintervalle, und Hypothesentests können auf der Grundlage des Binomials durchgeführt werden. $X_i-Y_i$ $P(X_i-Y_i<0) = p$ $I\{X_i-Y_i<0\}$ $i=1,2,..,n$ $X$ $X_i < Y_i$ $n$ $p=P(X_i-Y_i<0)$ $X/n$

Michael R. Chernick
quelle

2

Was ist die Basis der Paarung, Michael?

whuber

Das OP sagte: "Sei X die Zufallsvariable für die Verarbeitungszeit nach der Änderung und Y die vor" Also ist Xi nach dem Eingriff und Yi ist vor.

Michael R. Chernick

Haben Sie bemerkt, dass die Zählungen (möglicherweise) unterschiedlich sind? Sie scheinen

anzunehmen . Ich lese, dass ein "Prozess" zeitlich ist und dass das

es vor einem Ereignis und das es nach einem Ereignis .

m = n

$m=n$

X_{i}

$X_i$

Y_{j}

$Y_j$

Whuber

1

Du hast recht. Ich denke, ein Test mit zwei Stichproben wie der von jbowman oben vorgeschlagene Wilcoxon wäre angemessen. Interessanterweise zählt die Mann-Whitney-Form des Tests die Anzahl der Xis <Yjs.

Michael R. Chernick

Stellen Sie fest, ob sich ein verteilter Prozess mit starkem Schwanz erheblich verbessert hat

Antworten: