Sei , , ..., iid RVs mit Bereich aber unbekannter Verteilung. (Ich kann davon ausgehen, dass die Verteilung kontinuierlich ist, falls erforderlich.)
Definiere .
Ich und frage: Was kann ich auf Bayes'sche Weise über ?
Das heißt, ich erhalte die Summe einer Stichprobe der Größe der Wohnmobile und möchte wissen, was ich über die Verteilung der Summe aller Wohnmobile unter Verwendung eines Bayes'schen Ansatzes (und unter Annahme vernünftiger Prioritäten für die Wohnmobile) schließen kann Verteilung).
Wenn die Unterstützung anstelle von , ist dieses Problem gut untersucht, und (mit einheitlichen Prioritäten) erhalten Sie Beta-Binomialverbindungsverteilungen für die abgeleitete Verteilung auf . Aber ich bin mir nicht sicher, wie ich es mit als Bereich angehen soll ...
Vollständige Offenlegung : Ich habe dies bereits auf MathOverflow gepostet , aber es wurde mir gesagt, dass es besser ist, hier zu posten. Dies ist also eine erneute Veröffentlichung .
Antworten:
Betrachten Sie die folgende nichtparametrische Bayes'sche Analyse.
Definieren Sie und lassen Sie die Borel-Teilmengen von . Sei ein endliches Maß ungleich Null über .B X α ( X , B )X=[0,1] B X α (X,B)
Sei ein Dirichlet-Prozess mit dem Parameter und nehme an, dass bedingt iid sind, vorausgesetzt , so dass für jedes .α X 1 , … , X n Q = q μ X 1 ( B ) = P { X 1 ∈ B } = q ( B ) B ∈ B.Q α X1,…,Xn Q=q μX1(B)=P{X1∈B}=q(B) B∈B
Aus den Eigenschaften des Dirichlet-Prozesses wissen wir, dass bei die prädiktive Verteilung einer zukünftigen Beobachtung wie das Maß over definiert durch X k + 1 β ( X , B ) β ( B ) = 1X1,…,Xk Xk+1 β (X,B)
Definieren Sie nun als das von erzeugte Sigma-Feld und verwenden Sie die Messbarkeit und die Symmetrie der , um fast sicher.X 1 ,…, X k X i E [ S n ≤ F k ] = S k +E [ n ≤ i = k + 1 X iFk X1,…,Xk Xi
Um eine explizite Antwort zu finden, nehme an, dass ist . Definieren , haben wir fast sicher (die gemeinsame Verteilung von ), wobei . In der "nicht informativen" Grenze von reduziert sich die frühere Erwartung auf , was bedeutet, dass in diesem Fall Ihre hintere Schätzung für nur das fache des Mittelwerts des erstenU [ 0 , 1 ] c = α ( X ) > 0 E [ S n ∣ X 1 = x 1 , ... , X k = x k ] = s k + n - kα(⋅)/α(X) U[0,1] c=α(X)>0 [ μ X 1 , … , X k ] X 1 , … , X k s k = x 1 + ⋯ + x k c → 0 n ⋅ ( s k / k ) S n
quelle
Verzeihen Sie den Mangel an Maßtheorie und den Missbrauch der Notation im Folgenden ...
Da es sich um eine Bayes'sche Folgerung handelt, muss das Problem, das in diesem Fall die Verteilung von , ein unendlich-dimensionaler Parameter sein, der Werte in der Menge der Verteilungen auf annimmt (nennen Sie es ). Die Datenverteilung konvergiert gegen eine Normalverteilung. Wenn also groß genug ist ( Berry-Esseen-Theorem ), können wir diese Normalen nur als Annäherung einschlagen. Wenn die Näherung genau ist, ist der einzige Aspekt des vorherigen , der in praktischer Hinsicht von Bedeutung ist, der induzierte Prior von . [ 0 , 1X1 [0,1] π Sk|π k p(π) (Eπ(X1),Varπ(X1))=(μ,σ2)
Jetzt machen wir eine Standard-Bayes'sche Vorhersage und geben die ungefähren Dichten ein. ( unterliegt der gleichen Annäherung wie .)Sn Sk
Für die Grenzen des Integrals ist offensichtlich; Ich denke ?μ∈[0,1] σ2∈[0,14]
Später hinzugefügt: nein,Das ist schön - die zulässigen Werte von hängen von , daher sind Informationen in den Daten zu für relevant .σ 2 μ μ σ 2σ2∈[0,μ(1−μ)]. σ2 μ μ σ2
quelle
Jedes gehöre zur Verteilungsfamilie und habe Parameter .Xi F θ
Gegeben, , wir haben eine Verteilung auf :Sk θ
Und unsere Verteilung auf , istSn n≥k
(und ähnlich für )n<k
Beide Gleichungen haben schöne Formen, wenn eine Verteilung in der Exponentialfamilie ist, die unter Summation von iid-Elementen wie der Normalverteilung, der Gammaverteilung und der Binomialverteilung geschlossen wird. Es funktioniert auch für ihre Sonderfälle wie die Exponentialverteilung und die Bernoulli-Verteilung.F
Es könnte interessant sein zu betrachten, dass die Familie der skalierten (durch ) Binomialverteilungen mit bekannten "Versuchen" ist und die Grenze nimmt, wenn gegen unendlich geht.1F nn1n n n
quelle