In bestimmten Fällen wird der Jeffreys-Prior für ein vollständiges mehrdimensionales Modell im Allgemeinen als unzureichend angesehen. Dies ist beispielsweise der Fall in: (wobei , mit und unbekannt) in dem vor dem folgenden (in vollen Jeffreys vor bevorzugt wird ): wobei der Jeffreys-Prior ist, der erhalten wird, wenn festgehalten wird (und ähnlich für ). Dieser Prior stimmt mit dem Referenzprior überein, wenn behandelt wird
Frage 1: Warum ist es sinnvoller, sie als separate Gruppen zu behandeln, als sie in derselben Gruppe zu behandeln (was, wenn ich richtig bin (?), Zu Jeffreys Prior in voller Dimension führt, siehe [1])?
Man betrachte dann die folgende Situation: Wo & thgr; ∈ R n unbekannt ist, ε i ~ N ( 0 , & sgr; 2 ) , σ ist unkown, und g ist eine bekannte nicht-lineare Funktion. In einem solchen Fall ist es verlockend und meiner Erfahrung nach manchmal fruchtbar, die folgende Zerlegung in Betracht zu ziehen: p ( σ , θ ) = π ( σ ) π ( θ )
Frage 2: Können wir in einer solchen Situation etwas über die Optimalität (aus informationstheoretischer Sicht) des abgeleiteten Priores sagen ?
[1] Aus https://theses.lib.vt.edu/theses/available/etd-042299-095037/unrestricted/etd.pdf :
Schließlich stellen wir fest, dass Jeffreys Prior ein Sonderfall eines Referenzprior ist. Insbesondere entspricht Jeffreys Prior dem Referenzprior, in dem alle Modellparameter in einer einzigen Gruppe behandelt werden.
Antworten:
Was ist optimal? Es gibt kein allgemeines und allgemeines "Optimalitäts" -Ergebnis für Jeffreys Prior. Alles hängt vom Zweck der statistischen Analyse und der Verlustfunktion ab, die zur Bewertung und zum Vergleich von Verfahren herangezogen wird. Ansonsten istπ(θ,σ)∝1σ π(θ,σ)∝1σ2
quelle