Konfidenzintervalle für ein Polynom

8

Ich habe eine Zufallsvariable Z die Werte in den nichtnegativen ganzen Zahlen annimmt. Nenne {0,1,2,}die Wahrscheinlichkeiten für jedes Ergebnis zk:=P[Z=k] . Ich kann unabhängig und billig aus Z Distribution probieren . Ich habe derzeit eine Stichprobengröße von 228 . Es scheint, dass z00.24,z10.18, mit ungefähr exponentiellem Abfall ist.

Ich habe eine Folge von quadratischen Formen mit positiven Koeffizienten:

  • Q0(z0)=14z02
  • Q1(z0,z1)=12z0z1
  • ...
  • Q7(z0,z1,,z7)=18(2z0z1+3z2z1+4z4z1+4z6z1+3z0z3+ +4z2z3+4z3z4+4z0z5+4z2z5+4z0z7)
  • ...

Was ich gerne hätte, ist ein Konfidenzintervall für die Qi , das weniger als 104 breit ist, aber ich werde alles nehmen, was ich bekommen kann.

Ich habe strenge Grenzen für das zi , und da die Koeffizienten der Q alle positiv sind, ist es einfach, diese in strenge Grenzen für die Q umzuwandeln. Aber ich weiß nicht, wie ich das mit Konfidenzintervallen richtig machen soll.


Um was geht's hier? Ich habe in der Zahlentheorie ein bizarres Phänomen gefunden, und ich weiß, wie ich beweisen kann, dass es wirklich passiert, aber tatsächlich erfordert dies einige Programmieranstrengungen meinerseits und eine beträchtliche Menge Zeit in unserem lokalen Cluster. Bevor ich diese Zeit investiere und unsere Maschine verstopfe, möchte ich sicherer sein als ich, dass das Phänomen real ist.

Ich möchte die Angemessenheit meiner Behauptung quantifizieren, dass und Q 7 < Q 8 . Meine Schätzungen gehen davon aus, dass Q 6 - Q 7 bei 5 10 - 4 liegt, weshalb ich CIs mit dieser Auflösung wollte.Q7<Q6Q7<Q8Q6Q75104

nA{1,2,,n}2nQk(n)k{2,3,,2n}Ak Q k = 1 Q 0 k Q k Q 7 < Q 6 Q 7 < Q 8Qk=limnQk(n). Es ist etwas schwierig zu beweisen, aber diese Grenzen existieren und . Nun ist es keine Überraschung, dass klein ist und mit zunehmendem zunimmt, einen Peak hat und dann exponentiell abfällt. Der bizarre Teil ist, dass es eine gegen 7 gibt. Das heißt, experimentell und . Das heißt, was keine Überraschung war, stimmt eigentlich nicht: Die Verteilung ist bimodal.kQk=1Q0kQkQ7<Q6Q7<Q8

Ich kann die 's (unter Verwendung einer Theorie) wie oben ohne die Grenze in Bezug auf diese andere Verteilung ausdrücken , die durch die ' s definiert ist. Das ist praktisch, weil ich eine Möglichkeit habe, die mithilfe einiger großer Berechnungen rigoros zu binden , wie ich oben erwähnt habe. Außerdem habe ich einen sehr großen Datensatz für die Variable.z i z i Z.QiziziZ

Kevin O'Bryant
quelle
Ihr Unbehagen in Bezug auf die Sprache der Konfidenzintervalle, aber ansonsten eine strenge Darstellung, lässt darauf schließen, dass Sie möglicherweise in der Lage sind, uns ein wenig mehr Informationen zu geben, um Ihnen zu helfen. Normalerweise können Sie eine von zwei Eigenschaften eines CI angeben: entweder seine Abdeckung oder seine Länge. Der andere wird durch die Daten bestimmt. Es ist jedoch ungewöhnlich, die Länge festzulegen: Sind Sie sicher, dass Sie dies möchten? Es ist auch unklar, ob Sie CIs für die Qs separat oder gleichzeitig benötigen. Vielleicht könnten Sie angeben, wofür Sie diese CIs verwenden möchten?
whuber

Antworten:

3

In meiner Antwort stelle ich viele Links zu Hintergrundmaterial bereit, um hier Platz zu sparen. Ich werde meine Antwort schreiben und die Informationen in den angegebenen Links verwenden.

Ich denke, ein Bayes'scher Ansatz passt natürlich zu diesem Problem, zumal Sie nur sich selbst überzeugen wollen. Es ist etwas kompliziert, Konfidenzintervalle zu verwenden, um die Frage zu beantworten, die Ihnen wirklich am Herzen liegt, wie plausibel es ist, dass und die Stichprobe aus dem Verteilung? Mit dem Bayes'schen Ansatz können Sie diese Frage direkt beantworten. Q 7 < Q 8 z iQ7<Q6Q7<Q8zi

Wahrscheinlichkeitsfunktion

Sei die beobachtete Häufigkeit des ganzzahligen Ergebnisses in Ihrer Stichprobe und sei die Stichprobengröße. Die Wahrscheinlichkeitsfunktion ist proportional zur Multinomialverteilung . Es hat die Form k N.fkkN

L(z0,...z8;f0,...f8)=i=08ziNfi .

Vorherige Verteilung

Die Dirichlet-Verteilung ist die natürliche Wahl für die vorherige Verteilung, da sie das konjugierte Prior für die multinomiale Wahrscheinlichkeit ist. Es hat die Form

p(z0,...z8;α0,...,α8)i=08ziαi1

Dieser Prior hat neun Hyperparameter (die Werte), und es ist ein bisschen , mit ihnen umzugehen. In diesem Kontext mit „großen Stichproben“ hat jede vernünftige Auswahl von Hyperparameterwerten einen vernachlässigbaren Einfluss auf das Ergebnis, aber ich denke, es lohnt sich, ein wenig Mühe in die Auswahl vernünftiger Werte zu investieren.αi

Hier ist, wie ich empfehle, die Hyperparameter einzustellen. Beachten Sie zunächst, dass unter dieser Verteilung . Beachten Sie als nächstes, dass die einfachste maximale Entropieverteilung über die Naturwerte die geometrische Verteilung ist . Also setzenE(zi)=αii=08αi

αi+1=rαi=riα0,0<r<1,

α0=A(1r1r9).

Dann ist , also die Verteilung des Werte werden auf eine (abgeschnittene) geometrische Verteilung zentriert. Außerdem ist , sodass der Wert von die Streuung um diese Erwartung steuert, aber keinen Einfluss auf die Erwartung hat selbst.ziVar(zi)1E(zi)=ri(1r1r9)zi A.Var(zi)1(A+1)A

Diese Spezifikation reduziert die Anzahl der Hyperparameter aus den neun Werte nur und . Ich werde die Diskussion über bestimmte Werte von und vorerst verschieben . r A r A.αirArA

Hintere Wahrscheinlichkeit des interessierenden Satzes

Die hintere Verteilung der -Werte ist die folgende Dirichlet-Verteilung:zi

p(z0,...z8|f0,...,f8)i=08ziαi+Nfi1.

Sei . Die hintere Wahrscheinlichkeit, an der Sie interessiert sind, istY={z0,...z8|Q7<Q6 and Q7<Q8}

Pr(Q7<Q6 and Q7<Q8|f0,...,f8)Yi=08ziαi+Nfi1dzi.

Dieses Integral ist unlösbar, aber Sie können die interessierende Wahrscheinlichkeit numerisch mit dem folgenden Monte-Carlo-Algorithmus berechnen.

Für von bis ,1 J.j1J

  1. Probieren Sie eine Reihe von Werten aus ihrer posterioren Verteilung aus.zi

  2. Verwenden Sie die abgetasteten Werte, um zu berechnen, wobei die Indikatorfunktion ist.yj=I(Q7<Q6)I(Q7<Q8)I()

Dann .Pr(Q7<Q6 and Q7<Q8|f0,...,f8)j=0JyjJ

Die Genauigkeit der Monte-Carlo-Näherung lautet wie folgt : : Mit erhalten Sie mindestens zwei von 20 Dezimalstellen Genauigkeit, mit erhalten Sie mindestens drei Dezimalstellen von Genauigkeit 19 mal von 20 usw.JJ=104J=106

Und wenn Ihre hintere Wahrscheinlichkeit von Interesse nicht nahe bei 0 oder 1 liegt, probieren Sie einfach weitere Daten aus, spülen Sie sie aus und wiederholen Sie sie.

Vorherige Hyperparameter, Teil zwei

Der Exponent von im Ausdruck für die hintere Dichte istzi

αi+Nfi1=Ari(1r1r9)+Nfi1=AE(zi)+Nfi1

Es ist ersichtlich, dass der Hyperparameter in der vorherigen Verteilung dieselbe Rolle spielt wie in der Wahrscheinlichkeit - es ist eine Art "vorherige Stichprobengröße". Um sicherzustellen, dass der Prior einen vernachlässigbaren Einfluss auf die Schlussfolgerung hat, wählen Sie einfach einen Wert von so dass ; Zum Beispiel ist .ANAANA=1

Um zu setzen , beachten Sie, dass Sie die vorherige Wahrscheinlichkeit des Satzes mit demselben oben beschriebenen Monte-Carlo-Algorithmus berechnen können, wobei jedoch die vorherige Verteilung anstelle der posterioren Verteilung in Schritt 1 des Satzes Schleife. Versuchen Sie, einen Wert von zu finden , der eine vorherige Wahrscheinlichkeit von 0,5 ergibt (oder weniger, wenn Sie der Meinung sind, dass dies vernünftiger ist).rQ7<Q6 and Q7<Q8r

Cyan
quelle
Nein, ich überspringe nur einige technische Details. Eine technisch vollständigere Analyse würde mit einem Dirichlet-Prozess beginnen und dann zeigen, dass das Ergebnis der Marginalisierung des zählbar unendlichen Satzes irrelevanter Parameter die oben angegebene Dirichlet-Verteilung ist. zi
Cyan
1

Ich nehme an, die z_k sind keine Wahrscheinlichkeiten, sondern Abtastfrequenzen. Dies liegt daran, dass Q_i (z_0, ..., z_i) ansonsten keine Zufallsvariable ist. In diesem Fall ist die Berechnung der Varianz der Q_i eine einfache Algebra. Definieren Sie zunächst die Ereignisindikatoren Z_i, die 1 sind, wenn Z == i, andernfalls 0. Es ist eine Bernoulli-Zufallsvariable mit der Wahrscheinlichkeit p_i. Sie können den ersten und zweiten Moment jeder dieser Variablen berechnen und sie sollten Ihnen alle notwendigen Begriffe zur Berechnung der Varianz der Q_i geben.

AdamO
quelle
Nein, die sind Konstanten der Natur und folglich auch . Es ist eine reelle Zahl, aber die Frage ist, welche reelle Zahl. Mein Sampling läßt schätze ich die , und wenn ich die in die Formel verbindet Stecker zum ich eine Schätzung für bekommen (etwa ). Aber ich verstehe nicht, wie gut diese Schätzung ist. Wenn ich 99% CIs für jedes nehme und diese anschließe, erhalte ich ein Intervall, aber wie hoch ist das Konfidenzniveau? Ich denke auch nicht, dass die CIs für das unabhängig sind. ziQ7z^iQ7ziQ70.07zizi
Kevin O'Bryant
Mangelnde Unabhängigkeit ist hier kein Problem, Kevin (Sie können dies rechtfertigen, indem Sie die wahre multinomiale Verteilung des analysieren, wenn Sie dies wünschen). z^i
whuber
Da Sie aus Ihren Daten bereits eine Schätzung für berechnen können, können Sie eine Resampling-Technik wie Bootstrap verwenden, um ein CI für zu finden . en.wikipedia.org/wiki/Bootstrapping_(statistics)Q7Q7
Zen
@Zen: Ich hatte von Bootstrapping gehört, hätte aber nie gedacht, dass mir das passieren würde. Im Ernst, ich versuche es zum Laufen zu bringen, aber es ist zeitaufwändig, 1000 Mal neu abzutasten (jedes Resampling hat Punkte). Selbst 1000 Resamples der Größe benötigen 2 Stunden. 228216
Kevin O'Bryant
1

Kevin, bitte sei vorsichtig, da ich deine Notation ein wenig ändern muss: deine sind nicht meine .zizi

Ich denke, die folgende Bayes'sche Lösung ist einen Versuch wert. Kochen Sie einen zufälligen Parameter und lassen Sie bedingt iid sein, wenn , mit . Verwenden Sie die Notation . Sie haben bereits eine Stichprobe der mit . Definieren Sie die Zufallsvariablen Für (falls dies der ist nicht klar, werfen Sie einen Blick ). Nun, in dieser Formulierung Ihre quadratischen FormenΛ>0Z1,,ZnΛ=λZiΛ=λPoisson(λ)Z=(Z1,,Zn)z=(z1,,zn)Zin=228

Θi=P{Zi=kΛ}=eΛΛkk!,
i0Qi=Qi(Θ0,,Θi)=Qi(Λ) sind Funktionen von . Die sind also zufällig und Sie möchten die hintere Wahrscheinlichkeit Mit einem früheren haben wir nach dem Bayes-Theorem Sie berechnen Erzeugung von iid aus der vorherigen Verteilung (verwenden Sie R !) Und berechnen ΛQi
P{Q7<Q6andQ7<Q8Z=z}.()
ΛGamma(a,b)
ΛZ=zGamma(a+i=1nzi,b+n).
()λi( ) n = 2 28 a b
1Ni=1NI(,Q6(λi))(Q8(λi),)(Q7(λi)),
was durch das starke Gesetz der großen Zahlen fast sicher zu konvergiert . Um ein "Ja" zu Ihrer ursprünglichen Frage zu erhalten, muss diese hintere Wahrscheinlichkeit "groß genug" sein. Mit solch einer großen Stichprobe ( ) denke ich, dass es möglich ist, mit den Werten von und zu spielen, um Ihre vorherige Wahl nicht viel "informativ" zu machen.()n=228ab
Zen
quelle
Diese Poisson-Verteilung scheint eine eher restriktive Annahme zu sein, oder?
Cyan
Wir brauchen eine Distribution, deren Unterstützung ist, die die Berechnungen ermöglicht. Mal sehen, was Kevin mit diesem Modell finden kann. Z+
Zen