Welche Distributionen haben geschlossene Lösungen für die Abschätzung der maximalen Wahrscheinlichkeit?

Antworten:

25

Ohne nennenswerten Verlust der Allgemeinheit können wir annehmen, dass die Wahrscheinlichkeitsdichte (oder Masse) für jede Beobachtung x i (von n Beobachtungen) streng positiv ist, was es uns ermöglicht, sie als Exponential zu schreibenf(xi)xin

f(xi)=exp(g(xi,θ))

für einen Parametervektor .θ=(θj)

Das Gleichsetzen des Gradienten der logarithmischen Wahrscheinlichkeitsfunktion mit Null (die stationäre Punkte der Wahrscheinlichkeit findet, unter denen sich alle inneren globalen Maxima befinden, falls eines existiert) ergibt einen Satz von Gleichungen der Form

idg(xi,θ)dθj=0,

eine für jeden . Damit eine dieser Bedingungen erfüllt ist , möchten wir in der Lage sein, die x i -Terme von den θ -Termen zu trennen . (Alles ergibt sich aus dieser Schlüsselidee, die durch das Prinzip der mathematischen Faulheit motiviert ist : Machen Sie so wenig Arbeit wie möglich; denken Sie vor dem Rechnen voraus; packen Sie zuerst einfache Versionen schwieriger Probleme an.) Der allgemeinste Weg, dies zu tun, besteht darin, die Gleichungen zu erstellen die Formjxiθ

i(ηj(θ)τj(xi)αj(θ))=ηj(θ)iτj(xi)nαj(θ)

für bekannte Funktionen , τ j und α j , denn dann wird die Lösung durch Lösen der simultanen Gleichungen erhaltenηjτjαj

nαj(θ)ηj(θ)=iτj(xi)

für . Im Allgemeinen werden diese schwer zu lösen sein, vorausgesetzt, die Menge der Werte von ( n α j ( θ )θvollständige Informationen überθ geben, wir könnten diesen Vektor einfachanstelle vonθselbst verwenden (wodurch die Idee einer "geschlossenen Form" -Lösung etwas verallgemeinert wird, aber auf eine hochproduktive Weise). In einem solchen Fallergibt dieIntegration in Bezug auf&thgr;j(nαj(θ)ηj(θ))θ θθj

g(x,θ)=τj(x)θηj(θ)dθjθαj(θ)dθj+B(x,θj)

(wobei für alle Komponenten von & thgr ; mit Ausnahme von & thgr ; j steht ). Da die linke Seite funktionell unabhängig ist & theta; j , müssen wir haben gezeigt, dass τ j ( x ) = T ( x ) für einige feste Funktion T ; dass B überhaupt nicht von θ abhängen darf ; und η j sind Derivate einer Funktion H ( θ ) und der α j sind Derivate von irgendeiner anderen Funktion Aθjθθjθjτj(x)=T(x)TBθηjH(θ)αj , beide funktional unabhängig von den Daten. WoherA(θ)

g(x,θ)=H(θ)T(x)A(θ)+B(x).

Dichten, die in dieser Form geschrieben werden können, bilden die bekannte Koopman-Pitman-Darmois- oder Exponentialfamilie . Es umfasst wichtige Parameterfamilien, sowohl kontinuierliche als auch diskrete, einschließlich Gamma, Normal, Chi-Quadrat, Poisson, Multinomial und viele andere .

whuber
quelle
Und für diejenigen, die keine geschlossenen Formulare haben, können wir den EM-Algorithmus verwenden. Betrachten Sie zum Beispiel das Null-aufgepumpte Poisson-Modell: stats.stackexchange.com/questions/32133/…
Damien
0

Ich weiß nicht, ob ich sie alle auflisten könnte. Das Exponentielle, das Normale und das Binomiale fallen in die Klasse der Exponentialfamilien. Die Exponentialfamilie hat eine ausreichende Statistik im Exponenten und die mle ist oft eine nette Funktion dieser ausreichenden Statistik.

Michael R. Chernick
quelle
8
Diese Frage ist unglaublich weit gefasst, aber es scheint, als würde das OP fragen, was eine Distribution auszeichnet, die eine geschlossene Lösung für die MLE bietet, anstatt eine vollständige Liste anzufordern. Eine vollständige Auflistung ist jedenfalls nicht möglich.
Makro
2
[logxlog(1x)]Tab
Danke Neil, dass er darauf hingewiesen hat. Ich denke nicht alle exponentiellen Familienverteilungen haben geschlossene Lösungen.
Michael R. Chernick