Parameterschätzung der Exponentialverteilung mit vorgespannter Abtastung

8

Ich möchte den Parameter der Exponentialverteilung aus einer Stichprobenpopulation berechnen, die unter voreingenommenen Bedingungen aus dieser Verteilung entnommen wurde. Soweit ich weiß, ist für eine Stichprobe von n Werten der übliche Schätzer . Meine Stichprobe ist jedoch wie folgt voreingenommen:e - λ x λ = nλeλxλ^=nxi

Aus einer vollständigen Population von m Elementen, die aus der Exponentialverteilung gezogen wurden, sind nur die n kleinsten Elemente bekannt. Wie kann ich den Parameter in diesem Szenario schätzen ?λ

Etwas formeller, wenn iid-Stichproben sind, die aus , so dass wir für jedes , dann wie kann ich schätzen aus der Menge \ {x_1, x_2, x_3, ..., x_n \} wo n <m .e - λ x i < j x ix j λ { x 1 , x 2 , x 3 , . . . , x n } n < m{x1,x2,x3,...,xm}eλxi<jxixjλ{x1,x2,x3,...,xn}n<m

Vielen Dank!

Michael

Michael
quelle
1
Kennen Sie den Wert von ? m
Jbowman
3
Dies ist eine Zensur vom Typ II ( en.wikipedia.org/wiki/Censoring_%28statistics%29 ). Nun kann gezeigt werden, dass die übliche Wahrscheinlichkeit in der Überlebensanalyse auch für einen Zensurmechanismus vom Typ II gilt.
Ocram
1
Die Rollen von und scheinen während dieser Antwort vertauscht zu werden. nmn
Kardinal
Danke, du hast recht. Ich habe die Rollen von m und n in der Erklärung des Problems festgelegt.
Michael

Antworten:

8

Der Maximum-Likelihood-Schätzer für den Parameter der Exponentialverteilung unter Typ-II-Zensur kann wie folgt abgeleitet werden. Ich gehe davon aus, dass die Stichprobengröße , von denen die kleinsten beobachtet werden und die größten nicht beobachtet werden (aber bekanntermaßen existieren).mm - nn<mmn

Nehmen wir (zur Vereinfachung der Notation) an, dass das beobachtetexi geordnet sind: . Dann ist die gemeinsame Wahrscheinlichkeitsdichte von x 1 , , x n :0x1x2xnx1,,xn

f(x1,,xn)=m!λn(mn)!exp{λi=1nxi}exp{λ(mn)xn}

wobei sich das erste Exponential auf die Wahrscheinlichkeiten des beobachteten x i und das zweite auf die Wahrscheinlichkeiten des m - n unbeobachteten x i bezieht, die größer als x n sind (was nur 1 ist - die CDF bei x n ) zu:nximnxixnxn

f(x1,,xn)=m!λn(mn)!exp{λ[i=1n1xi+(mn+1)xn]}

(Beachten Sie, dass die Summe zu läuft, da der Koeffizient von x n ein " + 1 " enthält .) Wenn Sie das Protokoll nehmen, führt die Ableitung wrt λ usw. zum Maximum-Likelihood-Schätzer:n1+1xnλ

λ^=n/[i=1n1xi+(mn+1)xn]

Jbowman
quelle
1
Gute Antwort. Haben Sie versehentlich und n im Vergleich zur Frage gewechselt? mn
Neil G
2
@NeilG - danke! Mir ist gerade aufgefallen, dass das OP im Text von "aus einer vollständigen Population von Elementen wird gezeichnet ... nur die n kleinsten sind bekannt" auf m < n umgeschaltet wurde . Ich werde klären, welche Notation ich in einer Bearbeitung verwende ...mnm<n
jbowman
2

Dies verlinkt @ jbowmans Antwort auf meinen Kommentar. Unter allgemeinen Arbeitsannahmen kann man nämlich die "Standardüberlebenswahrscheinlichkeit" unter Typ-II-Zensur verwenden.

> #------seed------
> set.seed(1907)
> #----------------
> 
> #------some data------
> t <- sort(rexp(n=20, rate=2))        #true sample
> t[16:20] <- t[15]                    #observed sample
> delta <- c(rep(1, 15), rep(0, 5))    #censoring indicator
> data <- data.frame(t, delta)         #observed data
> #---------------------
> 
> #-----using @jbowman's formula------
> 15 / (sum(t[1:14]) + (5 + 1)*t[15])
[1] 2.131323
> #-----------------------------------
> 
> #------using the usual survival likelihood------
> library(survival)
> fit <- survreg(Surv(t, delta)~1, dist="exponential", data=data)
> exp(-fit$coef)
(Intercept) 
   2.131323 
> #-----------------------------------------------

PS1: Beachten Sie, dass dies nicht auf die Exponentialverteilung beschränkt ist.

PS2: Details finden Sie in Abschnitt 2.2 des Buches von Lawless .

ocram
quelle
1

n

Φ(xk)=1eλxk(k/n)xk0<k<mk

nΦkk/nk=n/2

Dave
quelle