Hintergrund
Eine der am häufigsten verwendeten Schwachstellen vor der Varianz ist das inverse Gamma mit den Parametern (Gelman 2006) .
Diese Verteilung hat jedoch einen 90% von ungefähr .
library(pscl)
sapply(c(0.05, 0.95), function(x) qigamma(x, 0.001, 0.001))
[1] 3.362941e+19 Inf
Daraus interpretiere ich, dass die eine geringe Wahrscheinlichkeit für eine sehr hohe Varianz und eine sehr geringe Wahrscheinlichkeit für eine Varianz von weniger als 1 ergibt .P ( σ < 1 | & agr; = 0,001 , β = 0,001 ) = 0,006
pigamma(1, 0.001, 0.001)
[1] 0.006312353
Frage
Vermisse ich etwas oder ist das eigentlich ein informativer Vorgänger?
Update zur Verdeutlichung, der Grund, warum ich dies als "informativ" betrachte, ist, dass es sehr stark behauptet, dass die Varianz enorm ist und weit über die Skala von fast jeder jemals gemessenen Varianz hinausgeht.
Follow-up: Würde eine Metaanalyse einer großen Anzahl von Varianzschätzungen eine vernünftigere Vorauswahl ermöglichen?
Referenz
Gelman 2006. Frühere Verteilungen für Varianzparameter in hierarchischen Modellen . Bayesian Analysis 1 (3): 515–533
quelle
Antworten:
Mit der inversen Gammaverteilung erhalten wir:
Sie können leicht erkennen, dass bei und das inverse Gamma sich den Jeffreys vor nähert. Diese Verteilung wird als "nicht informativ" bezeichnet, da sie eine angemessene Annäherung an die Jeffreys-Prioritäten darstelltα → 0β→ 0 α → 0
Was für Skalenparameter nicht aussagekräftig ist, siehe hier beispielsweise Seite 18 , da dieser Prior der einzige ist, der bei einem Skalenwechsel invariant bleibt (beachten Sie, dass die Approximation nicht invariant ist). Dies hat ein unbestimmtes Integral von was anzeigt, dass es nicht korrekt ist, wenn der Bereich von entweder oder . Aber diese Fälle sind nur Probleme in der Mathematik - nicht in der realen Welt. Beobachten Sie niemals einen unendlichen Wert für die Varianz, und wenn die beobachtete Varianz Null ist, haben Sie perfekte Daten !. Sie können nämlich eine Untergrenze von und eine Obergrenze von festlegen , und Ihre Verteilung ist korrekt.σ 2 0 ≤ L > 0 U < ≤Log( σ2) σ2 0 ∞ L > 0 U< ∞
Es mag seltsam erscheinen, dass dies "nicht informativ" ist, da es kleine Varianz gegenüber großen bevorzugt, aber dies ist nur in einem Maßstab. Sie können zeigen, dass eine falsche gleichmäßige Verteilung hat. Dieser Prior bevorzugt also keine Skala gegenüber einer anderenLog( σ2)
Obwohl dies nicht direkt mit Ihrer Frage zusammenhängt, würde ich eine "bessere" nicht informative Verteilung vorschlagen, indem ich die oberen und unteren Grenzen und in den Jeffreys vor und wähle . Normalerweise können die Grenzen ziemlich einfach mit ein wenig Nachdenken darüber festgelegt werden, was in der realen Welt tatsächlich bedeutet. Wenn es sich um einen Fehler in irgendeiner physikalischen Größe handelte - kann nicht kleiner sein als ein Atom oder die kleinste Größe, die Sie in Ihrem Experiment beobachten können. WeitereU α β σ 2 L UL U α β σ2 L U könnte nicht größer sein als die Erde (oder die Sonne, wenn Sie wirklich konservativ sein wollten). Auf diese Weise behalten Sie Ihre Invarianzeigenschaften bei, und es ist einfacher, vor der Stichprobe Folgendes zu entnehmen: und dann den simulierten Wert as .σ 2 ( bq( b )∼ U n i fo r m (log( L ) , log( U) ) σ2( b )= exp( q( b ))
quelle
Es ist ziemlich flach. Der Median liegt bei 1,9 E298, fast die größte Zahl, die man in Gleitberechnung mit doppelter Genauigkeit darstellen kann. Wie Sie hervorheben, ist die Wahrscheinlichkeit, die einem nicht wirklich großen Intervall zugewiesen wird, sehr gering. Es ist schwer, weniger informativ zu werden!
quelle