Man betrachte unabhängige Stichproben die aus einer Zufallsvariablen , von der angenommen wird, dass sie einer abgeschnittenen Verteilung (z. B. einer abgeschnittenen Normalverteilung ) bekannter (endlicher) Minimal- und Maximalwerte und aber unbekannter Parameter und folgen . Wenn einer nicht abgeschnittenen Verteilung folgt, wären die Maximum-Likelihood-Schätzer und für und aus der Stichprobenmittelwertund die Stichprobenvarianz . Für eine abgeschnittene Verteilung ist die auf diese Weise definierte Stichprobenvarianz jedoch durch sodass sie nicht immer ein konsistenter Schätzer ist: Für kann sie nicht mit der Wahrscheinlichkeit gegen konvergieren. als geht ins Unendliche. Es scheint also, dass und nicht die Maximum-Likelihood-Schätzer von und für eine abgeschnittene Verteilung sind. Dies ist natürlich seit dem und zu erwarten Parameter einer abgeschnittenen Normalverteilung sind nicht deren Mittelwert und Varianz.
Also, was sind die Maximum-Likelihood-Schätzer für die Parameter und einer abgeschnittenen Verteilung bekannter Minimal- und Maximalwerte?
Antworten:
Betrachten Sie jede Ortsskalenfamilie, die durch eine "Standard" -Verteilung wird.F
Unter der Annahme, dass differenzierbar ist, stellen wir leicht fest, dass die PDFs .F 1σf((x−μ)/σ)dx
Wenn diese Distributionen abgeschnitten werden, um ihre Unterstützung zwischen und ( einzuschränken , werden die PDFs durch ersetzta b a<b
(und sind Null für alle anderen Werte von ) wobei ist der Normalisierungsfaktor, der benötigt wird, um sicherzustellen, dass zur Einheit integriert wird. (Beachten Sie, dass ohne Kürzung identisch .) Die Log-Wahrscheinlichkeit für iid-Daten daherx C(μ,σ,a,b)=F(μ,σ)(b)−F(μ,σ)(a) f(μ,σ;a,b) C 1 xi
Kritische Punkte (einschließlich globaler Minima) werden gefunden, wenn entweder (ein Sonderfall, den ich hier ignoriere) oder der Verlauf verschwindet. Unter Verwendung von Indizes zur Bezeichnung von Ableitungen können wir den Gradienten formal berechnen und die Wahrscheinlichkeitsgleichungen wie folgt schreibenσ=0
Da und fest sind, sie aus der Notation und schreiben Sie als und als . (Ohne Kürzung wären beide Funktionen identisch Null.) Die Trennung der Terme, die die Daten betreffen, von den übrigen ergibta b nCμ(μ,σ,a,b)/C(μ,σ,a,b) A(μ,σ) nCσ(μ,σ,a,b)/C(μ,σ,a,b) B(μ,σ)
Wenn man diese mit der Situation ohne Verkürzung vergleicht, ist das offensichtlich
Alle ausreichenden Statistiken für das ursprüngliche Problem reichen für das abgeschnittene Problem aus (da sich die rechten Seiten nicht geändert haben).
Unsere Fähigkeit, geschlossene Lösungen zu finden, hängt von der Traktabilität von und . Wenn diese nicht auf einfache Weise und beinhalten , können wir nicht hoffen, dass wir im Allgemeinen geschlossene Lösungen erhalten.A B μ σ
Für den Fall einer normalen Familie ergibt sich natürlich aus der kumulierten normalen PDF, die einen Unterschied zwischen den Fehlerfunktionen darstellt: Es besteht keine Chance, dass eine Lösung in geschlossener Form vorliegt im Allgemeinen erhalten. Es gibt jedoch nur zwei ausreichende Statistiken (der Stichprobenmittelwert und die Varianz reichen aus), und die CDF ist so glatt wie möglich, sodass numerische Lösungen relativ einfach zu erhalten sind.C(μ,σ,a,b)
quelle