Sehr schöne Frage! Es wäre zwar sinnvoll, dass eine "gute" vorherige Verteilung dem "wahren" Parameter eine positive Wahrscheinlichkeit oder einen positiven Dichtewert , aber aus rein entscheidender Sicht muss dies nicht der Fall sein. Ein einfaches Gegenbeispiel zu dieser "Intuition", dass notwendig sein sollte, wenn die vorherige Dichte und der "wahre" Wert des Parameters ist, ist der Brillant Minimaxitätsergebnis von Casella und Strawderman (1981): bei der Schätzung eines normalen Mittelwerts basierend auf einer einzelnen Beobachtung mit der zusätzlichen Einschränkung, dass , π ( θ 0 ) > 0 π ( ⋅ ) θ 0 μ x ∼ N ( μ , 1 ) | μ | < ρ ρ ρ ≤ 1,0567 { - ρ , ρ } π - ρ ρ μ π ( θ ) = 1θ0
π( θ0) > 0
π( ⋅ )θ0μx ∼ N.( μ , 1 )| μ | <ρρist klein genug, , der Minimax-Schätzer entspricht einer (ungünstigsten) Uniform vor , was bedeutet, dass und ( gleiches Gewicht gibt) und keiner zu einem anderen Wert des Mittelwerts )
Wenn zunimmt, wächst die Unterstützung des ungünstigsten Prior, aber es bleibt eine endliche Menge möglicher Werte. Die hintere Erwartung kann jedoch einen beliebigen Wert für annehmen .
ρ ≤ 1,0567{ - ρ , ρ }π- ρρμρE[μ| x](-ρ,ρ)π( θ ) = 12δ- ρ( θ ) + 12δρ( θ )
ρE[μ|x](−ρ,ρ)
Der Kern der Diskussion (siehe Kommentare) könnte sein, dass, wenn der Bayes-Schätzer gezwungen wäre, ein Punkt für die Unterstützung von
, seine Eigenschaften ganz anders wären.π(⋅)
In ähnlicher Weise sind bei der Betrachtung zulässiger Schätzer Bayes-Schätzer, die einem ordnungsgemäßen Prior eines kompakten Satzes zugeordnet sind, normalerweise zulässig, obwohl sie eine eingeschränkte Unterstützung haben.
In beiden Fällen wird der Begriff frequentistischen (minimaxity oder Zulässigkeit) über den möglichen Bereich von Parametern definiert vielmehr , dass bei dem „wahren“ Wert des Parameters Zum Beispiel (das eine Antwort auf Frage 4. bringt), am hinteren Risiko suchen
oder auf Bayes-Risiko
beinhaltet nicht den wahren Wert . ∫ X ∫ & THgr; L(θ,δ)π(θ)f(x | θ)dθdx θ 0
∫ΘL(θ,δ)π(θ|x)dθ
∫X∫ΘL(θ,δ)π(θ)f(x|θ)dθdx
θ0
Darüber hinaus wird, wie im obigen Beispiel ausgeführt, der Bayes-Schätzer durch einen formalen Ausdruck wie den hinteren Mittelwert
für den quadratischen (oder ) Verlust kann dieser Schätzer Werte außerhalb der Unterstützung von , diese Unterstützung nicht konvex ist.L2π
θ^π(x)=∫Θθπ(θ|x)dθ
L2π
Nebenbei beim Lesen
Damit das wahre θ die Daten erzeugt hat (dh "existiert"), muss θ eine mögliche Variation unter π sein, z. B. eine Wahrscheinlichkeit ungleich Null, eine Dichte ungleich Null
Ich halte es für eine falsche Darstellung der Bedeutung eines Prior. Die vorherige Verteilung soll nicht für einen tatsächlichen physikalischen (oder realen) Mechanismus stehen, bei dem ein Parameterwert aus gefolgt von einer Beobachtung die aus . Der Prior ist ein Referenzmaß für den Parameterraum, das vorherige Informationen und subjektive Überzeugungen über den Parameter enthält und keineswegs eindeutig ist. Eine Bayes'sche Analyse ist immer relativ zu der zuvor ausgewählten, um diese Bayes'sche Analyse durchzuführen. Daher besteht keine absolute Notwendigkeit, dass der wahre Parameter zur Unterstützung von . Wenn es sich bei dieser Unterstützung um eine kompakte, verbundene Gruppe handelt, ist π x f ( x | θ 0 ) π A A θ πθ0πxf(x|θ0)πAEin Wert des Parameters außerhalb der Menge kann nicht konsistent durch den hinteren Mittelwert geschätzt werden , dies verhindert jedoch nicht einmal, dass der Schätzer zulässig ist.Aθ^π
Ja, es wird allgemein angenommen, dass das wahre im Bereich des Prior liegt. Es liegt in der Verantwortung des Statistikers, dafür zu sorgen, dass dies der Fall ist.θ
Normalerweise ja. Wenn Sie beispielsweise einen Mittelwert oder einen Standortparameter schätzen, hat jeder vorherige Wert den wahren Wert in seiner Domäne. (Wenn bekannt ist, dass der Parameter größer als Null ist, z. B. "mittlere Anzahl von Verkehrsunfällen auf der Bay Bridge pro Tag", muss der Prior offensichtlich keine negativen Werte enthalten.) Wenn wir eine Wahrscheinlichkeit schätzen, keine vor hat den wahren Wert in seiner Domäne. Wenn wir einen Prior für einen Varianzterm konstruieren, hat jeder Prior für den wahren Wert in seiner Domäne ... und so weiter.[ 0 , 1 ] ( 0 , ∞ )(−∞,∞) [0,1] (0,∞)
Wenn Ihr Posterior an einer Kante der Domäne des Prior "gestapelt" ist und Ihr Prior der Domäne an derselben Kante eine unnötige Einschränkung auferlegt, ist dies ein Ad-hoc-Indikator dafür, dass die unnötige Einschränkung möglicherweise Probleme verursacht. Dies sollte jedoch nur dann der Fall sein, wenn a) Sie einen Prior erstellt haben, dessen Form weitgehend von der Zweckmäßigkeit anstelle des tatsächlichen Vorwissens bestimmt wird, und b) die durch die Zweckmäßigkeit hervorgerufene Form des Prior die Domäne des Parameters auf eine Teilmenge dessen beschränkt, was " natürliche "Domäne kann als betrachtet werden.
Ein Beispiel hierfür ist eine alte, hoffentlich lange veraltete Praxis, den Prior auf einen Varianzterm zu beschränken, der leicht von Null entfernt ist, um mögliche Rechenschwierigkeiten zu vermeiden. Wenn der wahre Wert der Varianz zwischen der Grenze und Null liegt, ist es möglich, aber tatsächlich über die potenziellen Werte der Varianz nachzudenken, wenn die Daten gegeben sind, oder (zum Beispiel) stattdessen den Prior in das Protokoll der Varianz aufzunehmen Um dieses Problem zu vermeiden, und eine ähnliche milde Klugheit sollten Sie es ermöglichen, domänenbeschränkende Prioritäten im Allgemeinen zu vermeiden.
quelle
Die einfache, intuitive Antwort lautet, dass Prior Ihr Vorwissen über das widerspiegelt und das minimale Wissen, das Sie haben sollten, sich auf seine Domäne bezieht. Wenn Sie Bounded Prior verwenden, gehen Sie davon aus, dass die Werte außerhalb der Grenzen eine Wahrscheinlichkeit von Null haben und unmöglich sind. Dies ist eine sehr starke Annahme, die nicht ohne gute Begründung getroffen werden sollte. Aus diesem Grund verwenden Personen, die keine starken vorherigen Annahmen treffen möchten, vage Prioritäten für to .- ∞ ∞θ −∞ ∞
Abgesehen von dem begrenzten Fall sollte Ihr Posterior, wenn Ihre Probe wächst oder genauer gesagt mehr Informationen übermittelt, schließlich zu konvergieren, unabhängig von der vorherigen .θ
quelle