Vorausgesetzt, dass die hintere Schätzung von einer normalen Wahrscheinlichkeit und eines inversen Gammas vor σ 2 ist:
das ist äquivalent zu
da eine schwache , bevor sie auf σ 2 entfernt & alpha und β aus Gleichung 1:
Es ist offensichtlich, dass die hintere Schätzung von eine Funktion der Stichprobengröße und der Summe der Quadrate der Wahrscheinlichkeit ist. Aber was bedeutet das? Es gibt eine Ableitung auf Wikipedia , der ich nicht ganz folge.
Ich habe folgende Fragen
- Kann ich zu dieser zweiten Gleichung gelangen, ohne die Bayes-Regel aufzurufen? Ich bin gespannt, ob den Parametern einer IG etwas inhärent ist, das sich auf den Mittelwert und die Varianz bezieht, unabhängig von der normalen Wahrscheinlichkeit.
- Kann ich die Stichprobengröße und die Standardabweichung von einer früheren Studie verwenden, um einen informierten Prior auf zu schätzen und den Prior dann mit neuen Daten zu aktualisieren? Dies scheint unkompliziert zu sein, aber ich kann keine Beispiele dafür oder Gründe dafür finden, warum dies ein legitimer Ansatz wäre - außer dem, was im hinteren Bereich zu sehen ist.
- Gibt es ein beliebtes Wahrscheinlichkeits- oder Statistiklehrbuch, das ich zur weiteren Erklärung heranziehen kann?
Antworten:
Ich denke, es ist richtiger, von der posterioren Verteilung Ihres Parameters zu sprechen, als von seiner posterioren Schätzung. Zur Klarheit der Notationen werde ich im Folgenden die Primzahl in σ ′ 2 fallen lassen .σ′2 σ′2
Angenommen, als verteilt N ( 0 , σ 2 ) , - I fallen μ für jetzt ein heuristisches Beispiel zu machen - und 1 / σ 2 = σ - 2 verteilt sich wie Γ ( α , β ) und ist unabhängig von X .X N(0,σ2) μ 1/σ2=σ−2 Γ(α,β) X
Das PDF von mit σ - 2 ist Gaußsch, dhX σ−2
Wir können ähnliche Begriffe gruppieren und wie folgt umschreiben
Durch Teilen erhalten wir also
In Bezug auf Ihre Frage 2 können Sie natürlich die in einem früheren Experiment erhaltenen Werte als Ihre Prioritäten verwenden. Da wir oben eine Parallele zwischen Bayes'scher und frequentistischer Interpretation hergestellt haben, können wir näher darauf eingehen und sagen, dass es so ist, als würde man eine Varianz aus einer kleinen Stichprobengröße berechnen und dann mehr Datenpunkte sammeln: Sie würden Ihre Schätzung der Varianz aktualisieren, anstatt sie wegzuwerfen die ersten Datenpunkte.
Zu Ihrer Frage 3. Ich mag die Einführung in die mathematische Statistik von Hogg, McKean und Craig, die normalerweise Einzelheiten zur Ableitung dieser Gleichungen enthält.
quelle
Für Frage 1 folgt die zweite Gleichung aus der Bayes-Regel, wie Sie hervorheben, und ich sehe keinen Weg, dies zu vermeiden.
Bei Frage 2 können Sie dies tun. Verwenden Sie einfach einen Prior derselben Form wie Ihre zweite Gleichung.
Bei Frage 3 würde ich etwas über exponentielle Familien suchen. Vielleicht wird jemand eine gute Ressource empfehlen.
quelle