Was ist der Unterschied zwischen einer Teilwahrscheinlichkeit, einer Profilwahrscheinlichkeit und einer Grenzwahrscheinlichkeit?

56

Ich sehe, dass diese Begriffe verwendet werden, und ich verwechsle sie immer wieder. Gibt es eine einfache Erklärung für die Unterschiede zwischen ihnen?

Rob Hyndman
quelle

Antworten:

57

Die Wahrscheinlichkeitsfunktion hängt normalerweise von vielen Parametern ab. Abhängig von der Anwendung sind wir normalerweise nur an einer Teilmenge dieser Parameter interessiert. Beispielsweise liegt bei der linearen Regression das Interesse typischerweise in den Steigungskoeffizienten und nicht in der Fehlervarianz.

Bezeichnen Sie die Parameter, an denen wir interessiert sind, als β und die Parameter, die nicht von primärem Interesse sind, als θ . Der Standardweg, um sich dem Schätzproblem zu nähern, besteht darin, die Wahrscheinlichkeitsfunktion zu maximieren, so dass wir Schätzungen von β und θ . Da das Hauptinteresse jedoch auf β Partial liegt, bieten Profil und marginale Wahrscheinlichkeit alternative Möglichkeiten zur Schätzung von β ohne Schätzung von θ .

Um den Unterschied zu sehen, bezeichne die Standardwahrscheinlichkeit mit L(β,θ|data) .

Maximale Wahrscheinlichkeit

Finden Sie β und θ , die L(β,θ|data) maximieren .

Teilweise Wahrscheinlichkeit

Wenn wir die Wahrscheinlichkeitsfunktion schreiben können als:

L(β,θ|data)=L1(β|data)L2(θ|data)

L1(β|data)

Profil Wahrscheinlichkeit

θβθ

θ=g(β)

L(β,g(β)|data)

Grenzwahrscheinlichkeit

θθβ

Febstar
quelle
2
Beachten Sie, dass die letzte Definition hier eine integrierte (oder Bayes'sche) Wahrscheinlichkeit ist, keine marginale Wahrscheinlichkeit.
Ars
Ist dies in der RHS für die Teilwahrscheinlichkeit richtig: "L2 (θ | Theta)"?
Jpalecek
@ars, würden Sie bitte die Antwort bearbeiten und dann die Definition von Marginal Likelihood angeben?
Waldir Leoncio
13

Alle drei werden verwendet, wenn mit Störparametern in der vollständig spezifizierten Wahrscheinlichkeitsfunktion umgegangen wird.

Die marginale Wahrscheinlichkeit ist die primäre Methode, um Störparameter theoretisch zu eliminieren. Dies ist eine echte Wahrscheinlichkeitsfunktion (dh sie ist proportional zur (Grenz-) Wahrscheinlichkeit der beobachteten Daten).

Die Teilwahrscheinlichkeit ist im Allgemeinen keine echte Wahrscheinlichkeit. In einigen Fällen kann dies jedoch als Wahrscheinlichkeit einer asymptotischen Inferenz angesehen werden. In Cox-Proportional-Hazards-Modellen, in denen es seinen Ursprung hat, interessieren uns die beobachteten Rangfolgen in den Daten (T1> T2> ..), ohne die Grundgefahr anzugeben. Efron zeigte, dass die partielle Wahrscheinlichkeit für eine Vielzahl von Gefahrenfunktionen nur wenig bis gar keine Informationen verliert.

Die Profilwahrscheinlichkeit ist praktisch, wenn wir eine mehrdimensionale Wahrscheinlichkeitsfunktion und einen einzelnen interessierenden Parameter haben. Es wird spezifiziert, indem die Störung S durch ihre MLE bei jedem festen T (dem interessierenden Parameter) ersetzt wird, dh L (T) = L (T, S (T)). Dies kann in der Praxis gut funktionieren, obwohl die auf diese Weise erhaltene MLE eine potenzielle Verzerrung aufweist. Die marginale Wahrscheinlichkeit korrigiert diese Verzerrung.

ars
quelle