Ich habe eine Zufallsvariable die Werte in den nichtnegativen ganzen Zahlen annimmt. Nenne die Wahrscheinlichkeiten für jedes Ergebnis . Ich kann unabhängig und billig aus Distribution probieren . Ich habe derzeit eine Stichprobengröße von . Es scheint, dass mit ungefähr exponentiellem Abfall ist.
Ich habe eine Folge von quadratischen Formen mit positiven Koeffizienten:
- ...
- ...
Was ich gerne hätte, ist ein Konfidenzintervall für die , das weniger als breit ist, aber ich werde alles nehmen, was ich bekommen kann.
Ich habe strenge Grenzen für das , und da die Koeffizienten der alle positiv sind, ist es einfach, diese in strenge Grenzen für die umzuwandeln. Aber ich weiß nicht, wie ich das mit Konfidenzintervallen richtig machen soll.
Um was geht's hier? Ich habe in der Zahlentheorie ein bizarres Phänomen gefunden, und ich weiß, wie ich beweisen kann, dass es wirklich passiert, aber tatsächlich erfordert dies einige Programmieranstrengungen meinerseits und eine beträchtliche Menge Zeit in unserem lokalen Cluster. Bevor ich diese Zeit investiere und unsere Maschine verstopfe, möchte ich sicherer sein als ich, dass das Phänomen real ist.
Ich möchte die Angemessenheit meiner Behauptung quantifizieren, dass und Q 7 < Q 8 . Meine Schätzungen gehen davon aus, dass Q 6 - Q 7 bei 5 ⋅ 10 - 4 liegt, weshalb ich CIs mit dieser Auflösung wollte.
≤ k Q k = 1 Q 0 k Q k Q 7 < Q 6 Q 7 < Q 8. Es ist etwas schwierig zu beweisen, aber diese Grenzen existieren und . Nun ist es keine Überraschung, dass klein ist und mit zunehmendem zunimmt, einen Peak hat und dann exponentiell abfällt. Der bizarre Teil ist, dass es eine gegen 7 gibt. Das heißt, experimentell und . Das heißt, was keine Überraschung war, stimmt eigentlich nicht: Die Verteilung ist bimodal.
Ich kann die 's (unter Verwendung einer Theorie) wie oben ohne die Grenze in Bezug auf diese andere Verteilung ausdrücken , die durch die ' s definiert ist. Das ist praktisch, weil ich eine Möglichkeit habe, die mithilfe einiger großer Berechnungen rigoros zu binden , wie ich oben erwähnt habe. Außerdem habe ich einen sehr großen Datensatz für die Variable.z i z i Z.
quelle
Antworten:
In meiner Antwort stelle ich viele Links zu Hintergrundmaterial bereit, um hier Platz zu sparen. Ich werde meine Antwort schreiben und die Informationen in den angegebenen Links verwenden.
Ich denke, ein Bayes'scher Ansatz passt natürlich zu diesem Problem, zumal Sie nur sich selbst überzeugen wollen. Es ist etwas kompliziert, Konfidenzintervalle zu verwenden, um die Frage zu beantworten, die Ihnen wirklich am Herzen liegt, wie plausibel es ist, dass und die Stichprobe aus dem Verteilung? Mit dem Bayes'schen Ansatz können Sie diese Frage direkt beantworten. Q 7 < Q 8 z iQ7<Q6 Q7<Q8 zi
Wahrscheinlichkeitsfunktion
Sei die beobachtete Häufigkeit des ganzzahligen Ergebnisses in Ihrer Stichprobe und sei die Stichprobengröße. Die Wahrscheinlichkeitsfunktion ist proportional zur Multinomialverteilung . Es hat die Form k N.fk k N
Vorherige Verteilung
Die Dirichlet-Verteilung ist die natürliche Wahl für die vorherige Verteilung, da sie das konjugierte Prior für die multinomiale Wahrscheinlichkeit ist. Es hat die Form
Dieser Prior hat neun Hyperparameter (die Werte), und es ist ein bisschen , mit ihnen umzugehen. In diesem Kontext mit „großen Stichproben“ hat jede vernünftige Auswahl von Hyperparameterwerten einen vernachlässigbaren Einfluss auf das Ergebnis, aber ich denke, es lohnt sich, ein wenig Mühe in die Auswahl vernünftiger Werte zu investieren.αi
Hier ist, wie ich empfehle, die Hyperparameter einzustellen. Beachten Sie zunächst, dass unter dieser Verteilung . Beachten Sie als nächstes, dass die einfachste maximale Entropieverteilung über die Naturwerte die geometrische Verteilung ist . Also setzenE(zi)=αi∑8i=0αi
Dann ist , also die Verteilung des Werte werden auf eine (abgeschnittene) geometrische Verteilung zentriert. Außerdem ist , sodass der Wert von die Streuung um diese Erwartung steuert, aber keinen Einfluss auf die Erwartung hat selbst.ziVar(zi)∝1E(zi)=ri(1−r1−r9) zi A.Var(zi)∝1(A+1) A
Diese Spezifikation reduziert die Anzahl der Hyperparameter aus den neun Werte nur und . Ich werde die Diskussion über bestimmte Werte von und vorerst verschieben . r A r A.αi r A r A
Hintere Wahrscheinlichkeit des interessierenden Satzes
Die hintere Verteilung der -Werte ist die folgende Dirichlet-Verteilung:zi
Sei . Die hintere Wahrscheinlichkeit, an der Sie interessiert sind, istY={z0,...z8|Q7<Q6 and Q7<Q8}
Dieses Integral ist unlösbar, aber Sie können die interessierende Wahrscheinlichkeit numerisch mit dem folgenden Monte-Carlo-Algorithmus berechnen.
Für von bis ,1 J.j 1 J
Probieren Sie eine Reihe von Werten aus ihrer posterioren Verteilung aus.zi
Verwenden Sie die abgetasteten Werte, um zu berechnen, wobei die Indikatorfunktion ist.yj=I(Q7<Q6)I(Q7<Q8) I(⋅)
Dann .Pr(Q7<Q6 and Q7<Q8|f0,...,f8)≈∑Jj=0yjJ
Die Genauigkeit der Monte-Carlo-Näherung lautet wie folgt : : Mit erhalten Sie mindestens zwei von 20 Dezimalstellen Genauigkeit, mit erhalten Sie mindestens drei Dezimalstellen von Genauigkeit 19 mal von 20 usw.J−−√ J=104 J=106
Und wenn Ihre hintere Wahrscheinlichkeit von Interesse nicht nahe bei 0 oder 1 liegt, probieren Sie einfach weitere Daten aus, spülen Sie sie aus und wiederholen Sie sie.
Vorherige Hyperparameter, Teil zwei
Der Exponent von im Ausdruck für die hintere Dichte istzi
Es ist ersichtlich, dass der Hyperparameter in der vorherigen Verteilung dieselbe Rolle spielt wie in der Wahrscheinlichkeit - es ist eine Art "vorherige Stichprobengröße". Um sicherzustellen, dass der Prior einen vernachlässigbaren Einfluss auf die Schlussfolgerung hat, wählen Sie einfach einen Wert von so dass ; Zum Beispiel ist .A N A A≪N A=1
Um zu setzen , beachten Sie, dass Sie die vorherige Wahrscheinlichkeit des Satzes mit demselben oben beschriebenen Monte-Carlo-Algorithmus berechnen können, wobei jedoch die vorherige Verteilung anstelle der posterioren Verteilung in Schritt 1 des Satzes Schleife. Versuchen Sie, einen Wert von zu finden , der eine vorherige Wahrscheinlichkeit von 0,5 ergibt (oder weniger, wenn Sie der Meinung sind, dass dies vernünftiger ist).r Q7<Q6 and Q7<Q8 r
quelle
Ich nehme an, die z_k sind keine Wahrscheinlichkeiten, sondern Abtastfrequenzen. Dies liegt daran, dass Q_i (z_0, ..., z_i) ansonsten keine Zufallsvariable ist. In diesem Fall ist die Berechnung der Varianz der Q_i eine einfache Algebra. Definieren Sie zunächst die Ereignisindikatoren Z_i, die 1 sind, wenn Z == i, andernfalls 0. Es ist eine Bernoulli-Zufallsvariable mit der Wahrscheinlichkeit p_i. Sie können den ersten und zweiten Moment jeder dieser Variablen berechnen und sie sollten Ihnen alle notwendigen Begriffe zur Berechnung der Varianz der Q_i geben.
quelle
Kevin, bitte sei vorsichtig, da ich deine Notation ein wenig ändern muss: deine sind nicht meine .zi zi
Ich denke, die folgende Bayes'sche Lösung ist einen Versuch wert. Kochen Sie einen zufälligen Parameter und lassen Sie bedingt iid sein, wenn , mit . Verwenden Sie die Notation . Sie haben bereits eine Stichprobe der mit . Definieren Sie die Zufallsvariablen Für (falls dies der ist nicht klar, werfen Sie einen Blick ). Nun, in dieser Formulierung Ihre quadratischen FormenΛ>0 Z1,…,Zn Λ=λ Zi∣Λ=λ∼Poisson(λ) Z=(Z1,…,Zn) z=(z1,…,zn) Zi n=228
quelle